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HP : 机组成及 利: 编 i / dq ! 


本书以创新的视角介绍了计 S 机组成原理.主要以 Java 虚拟机 为例. 因为 Java 虛拟机是一个极为便 
利，时新，可移植以及几乎到处可得到的平台。 

本书主张读者在 Java 虛拟机的范围内彻底理解计算机组成的核心原理.然后将这些原理拓展到其他四 
个 S 主要的 平台： Intel 8088. Pentium 4. Power 体系结构及 Atmel AVR 微控制器使读者能快速掌握实际 
环境中计 S 机体系结构原理，提高实践和应用能力。 

本书主要内容 

• 计算.表示以及虚拟机的角色 # 

• 算术表 达式： 符号表示.存储程序计筲机及运 S . 

參 采用领先的开源 Java 汇编器 jasmin 进行汇编语言编程_ 

♦ 从 if 语句和循坏到子例程的控制结构^ 

參 真实的计 K 机体系 结构： 优化 CPU. 存储器及外设。 

• 8088. Pentmm 及 Power : 比较其组成、体系结构及汇编语言、 

• Pentium 和 Power 体系结构的性能问题.包括流水线 
• 微控 制器： 组成，体系结构.接口及程序设计， 

• 离级 Java 虚拟机 编程： g 杂和派生类型.类、继承.类操作. I/O 等。 

參 附录涵盖了数字 逻轺. Java 虛拟机指令 tt. 操作代码及类文件格式 
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本书以 Java 虚拟机为基础介绍计算机组织和系统结构。前半部分涵盖了计算机组织的一 
般原理，以及汇编语言编程的艺术，后半部分关注于各种不同 CPU 在系统结构上的特殊细节， 
包括奔腾、8088、 Power 系统结构以及作为典型嵌入式系统控制芯片例子的 AtmelAVR。 

本书全面反映了 IEEE 和 ACM 所推荐的标准计算机体系结构及组成课程应涵盖的知识要 
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出版者的话 


文艺复兴以降，源远流长的科学精神和逐步形成的学术规范，使西方国家在自然科学的 
各个领域取得了垄断性的优势，也正是这样的传统，使美国在信息技术发展的六十多年间名 
家辈出、独领风骚。在商业化的进程中，美国的产业界与教育界越来越紧密地结合，计算机 
学科中的许多泰山北斗同时身处科研和教学的最前线，由此而产生的经典科学著作，不仅擘 
划了研究的范畴，还掲示了学术的源变，既遵循学术规范，又自有学者个性，其价值并不会 
因年月的流逝而减退。 

近年，在全球信息化大潮的推动下，我国的计算机产业发展迅猛，对专业人才的需求日 
益迫切。这对计算机教育界和出版界都既是机遇，也是挑战，而专业教材的建设在教育战略 
上显得举足轻*。在我国信息技术发展时间较短的现状下，美国等发达国家在其计算机科学 
发展的几十年间积淀和发展的经典教材仍有许多值得借黎 之处。 因此，引进一批国外优秀计 
算机教材将对我国计算机教育亊业的发展起到积极的推动作用，也是与世界接轨、建设真正 
的世界一流大学的必由之路。 

机械工业出版社华章分社较早意识到“出版要为教育服务”。自1998年开始，华章分社就 
将工作 S 点放在了遴选、移译国外优秀教材上。经过多年的不懈努力，我们与 Pearson , 
McGraw - Hill , Elsevier ， MIT , John Wiley & Sons , Cengage 等世界著名出版公司建立了良好 
的合作关系，从他们现有的数 S * 种教材中 叛选出 Andrew S . Tanenbaum , Bjarne Stroustrup , 
Brain W . Kernighan , Dennis Ritchie，Jim Gray , Afred V . Aho , John E . Hopcroft , Jeffrey D . 
Ullman , Abraham Silbcrschatz , William Stallings , Donald E . Knuth , John L . Hcnnessy , Larry 
L . Peterson 等大师名家的一批经典作品，以“计算机科学丛书”为总称出版，供读者学习、研 
究及珍藏。大理石纹理的封面，也正体现了这套丛书的品位和格调。 

“计算机科学丛书”的出版工作得到了国内外学者 的鼎力 襄助，国内的专家不仅提供了中 
肯的选题指导，还不辞劳苦地担任了翻译和审校的工作，而原书的作者也相当关注其作品在 
中国的传播，有的还专程为其书的中译本作序。迄今，“计算机科学丛书”已经出版了近两百 
个品种，这些书籍在读者中树立了良好的口碑，并被许多髙校采用为正式教材和参考书籍。 
其影印版“经典原版书库”作为姊妹篇也被越来越多实施双语教学的学校所采用。 

权威的作者、经典的教材、一流的译者、严格的审校、精细的》辑，这些因紊使我们的 
图书有了质最的保证。随着计算机科学与技术专业学科建设的不断完善和教材改革的逐渐深 
化，教育界对国外计算机教材的需求和应用都将步入一个新的阶段，我们的目标是尽善尽美， 
而反馈的意见正是我们达到这一终极目标的重要帮助。华章分社欢迎老师和读者对我们的工 
作提出建议或给予指正，我们的联系方法如下： 

华章 网站： www.hzbook.com 
电子邮件： hzjsj@hzbook.com 
联系 电话： (010) 88379604 
联系 地址： 北京市西城区百万庄南街1号 
邮政 编码 ： 100037 
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当前，对于计算机组成与系统结构类的本科课程，在教学上的主要困难之一是难以选择 
一个合适的教学用体系结构。能清楚体现计算机组成和体系结构原理的芯片早已过时，而对 
于先进的奔腾机，这些基本原理則淹没于复杂的实现方法和策略中。 

本书作者意识到了目前计算机组织和系统结构在教学选材上的困难，并采取 JVM 作为教 
学体系结构。这是从新的角度进行的有益尝试。 JVM 非常简单、易于理解，因而可能会成为 
系统结构教学的最佳用机之一。但 JVM 毕竟与真实计算机存在物理差别，为表明这种差别， 
作者也有针对性地介绍了其他几种典型的体系结构。 

本书的特点是内容广泛且有一定深度，从最基本的电子器件、二进制表示和计算，到 
jasmin 汇编语言程序设计，再到现实世界中存在的计算机系统结构，最后到 JVM 高级编程课 
题，几乎涵盖了所有相关的主题。并且，在每个章节都提供了习题，以巩固知识。 

本书适合于作为大学二、三年级相关课程的教材或教学参考书。学生们通过一学期的学 
习，就能基本掌握计算机组成的基本原理及汇编语言编程。当然，如果学生们已经掌握了计 
算机的最基础知识，再学习本书则效果 更好。 

本书由三位老师合作翻译。吴为民翻译了第1、2、3、4、10章以及附录 A 、 C 、 D 、 E , 
艾丽华翻译了第5、6、7、8、9章，张大伟翻译了附录 B 。 由于本书的翻译工作是在繁忙的教 
学、科研工作之余完成的，难免有疏《之处，欢迎各位读者给 予批评 指正。 



译者 
2009年10月 
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本书内容 

这是一本关干 Java 虚拟机 （Java Virtual Machine, JVM) 组织和系统结构的书。 JVM 是处 
于 Java 语言 核心的软件，并出现在大多数计算机、 Web 浏览器、 PDA 以及网络化附属设备中。 
本书还涵盖了计算机组织和系统结构的一般原理，并以其他流行（或不那么流行）的计算机 
为例加以说明。 

这不是一本关于编程语言 Java 的书，虽然具备 Java 语言或类 Java 语言 （ C 、 C ++、 Pascal 、 
Algol 等）的一些知识会有所帮助。本书是一本关于 Java 语言如何使亨件发生以及计算如何产 
生的书。 

这本书的写作开始于一个现代技术的 实验。 当我开始任教于目前的大学时 （1998 年），计 
算机组织和系统结构课程用的主要是运行 MS - DOS 的8088,这个编程环境实质上与修这门课的 
二年级学生年龄相当。（遗憾的是，这种时间上的迟滞相当普遍。当我在本科修同样的课程时， 
所学系统结构的相应计算机只比我“年轻” 2年。）根本问题是现代奔腾4芯片不是特別好的教 
学用系统结构。它加入了有20年历史的8088的所有功能，包括其局限，并提供了复杂的变通 
方法。由干这个复杂性问题，就难以在不详细引用早已过时的芯片集的情况下解释淸楚奔腾4 
的工作原理。教科书主要讲解的是较简单的8088,然后作为扩展和后续思考来描述实 R 要使 
用的计 算机。 这就好比在福特 A 型上学习汽车力学，后来只讨论如催化式排气净化器、自动驾 
驶、基于钥匙的点火系统等 It 要槪念。计算机系统结构课程不应被迫成为计算历史的课程。 

与此不同的是，我想采用一种易于理解的系统结构来教这门课，该系统结构结合了现代 
原理且本身对学生有用。由于每个运行 Web 浏览器的计算机都结合了 JVM 的一个副本作为软 
件，因此几乎每个当今的计算机都已经有了兼容的 JVM 供其使用。 

因而这本书涵盖了计算机组织和系统结构的核心 方面： 数字逻辑和系统、数据表示以及 
计算机组织/系统结构。本书还描述了一种特定系统结构 JVM 的汇编级语言，并且介绍了其他 
常见的系统结构（如英特尔奔腾4和 Power PC ) 作为支持例子但不作为重点。正如 IEEE 计算 
机学会和美国计算机协会所推荐的，本书尤其适合作为计算机系统结构和组织的标准二年级 
课程 。 e 

组织 

本书包含两个部分。前半部分（第章）涵盖了计算机组织和系统结构的一般原理， 
以及汇编语言编程的艺术/科学，并采用了 JVM 作为例子来阐明这些原理如何起作用（在数字 
计算机中如何表示数？加栽器做哪些事情？格式转换涉及哪些事情？），以及 JVM 汇编语言编 
程中一些必要的细节，包括对操作代码的详细讨论（操作代码 12 C 要做哪些事情，它是如何改 
变堆栈的？运行汇编器的命令是什么）。本书的后半部分（第6~10章）关注于各种不同 CPU 
在系统结构上的特殊细节，包括奔腾、它的老亲戚8088、 Power •系统结构，以及作为典型嵌入 
式系统控制芯片例子的 Atmel AVR 。 




© ^Computing Curricula 2001.- 2001 年 12 月 15 日，最终草案，特别参见关于课程 CS220 的推荐意见。 
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这个框架将使得本书被广大读者和众多课程所使用，这是我的希望和信念。本书应能成 
功地服务于以软件为中心的计算机产业。对于那些主要感兴趣于将编程语言作为基础来学习 
抽象的计算机科学的人来说， JVM 对计算的基本操作提供了一个简单、易于理解的介绍。作 
为编译器理论、编程语言或操作系统课程的基础， JVM 是一个便利和可移植的平台和目标系 
统结构，比任何单芯片或操作系统有更广的可用性。作为进一步学习（特定平台的）各种计 
算机的基础， JVM 提供了一个有用的解释性教学系统结构，该系统结构不仅可向目前的奔腾， 
而且可向在未来可能取代或支持奔腾的其他系统结构，实现平滑的、有原则的过渡。对于有 
兴趣学习计算机如何工作的学生来说，本书将提供有关大董不同平台的信息，以增强使用实 
际计算机和系统结构的能力。 

如上所述，本书主要是作为本科二年级的单学期课程的教科书。前四章给出了理解计算 
机组织、系统结构以及汇编语言编程所需的核心材料。假设读者已经有了高级命令性语言的 
—些知识，并且熟悉高中代数（不是微积 分）。 在此基础上，教授（和学生）在选择主题方面 
有某种程度的灵活性，这取决于环境和具体问题。对于 Intel / Windows 工作组，关于8088和奔 
腾的章节就是有用和相关的，而对于有老式苹果机或基于 Motorola 微处理器实验室的学校， 
关于 Power 系统结构的章节更为相关。讲述 Atmel AVR 的一章可为嵌入式系统或微计算机实验 
室工作奠定基础，而高级的 JVM 课题将是打算以 JVM 系统结构为基础实现基于 JVM 的系统或 
编写系统软件（编译器、解释器 等等） 的学生之兴趣所在。进度快的课程甚至可能会涵盖本 
书所有的主题。书中还提供了附录供参考，因为我们相信，好的教科书应该在课程结束后仍 
是有用的。 
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第一部分假想计算机 


第1章计算和表示 


1.1 计算 



一台计算机 ^ -台杉 L 


1.1.1 电子设备 

有多少人真正知道计算机是什么？如果你问这个问题，大多数人会指向某人央子上（或 
者也许是某人公文包中）的一组盒子——这可能是一组由灰色塑料包装的、外形呆板的方形 
盒子，并且纠缠了一堆连线，类似于一台电视机 * 如果穷追细节，他们会指向某个盒？•，称 
之为“计算机”。不过当然也有计算机是隐藏在各种日常电子部件内部的，它们的作用可能是 
确保汽车的燃油效率足够高，解释来自 DVD 播放机的信号，甚至是确保早 S 面包烤得恰到好 
处。但是对于大多数人来说，计算机仍然是你从电子商店购买的盒子，并且还要常常比较其 
存储量 （如位数和字节数）和频率（如千兆赫），但很少有人真正明白其含义。 

用功能的术语来说，计算机就是一台高速的计算器，平均每秒能执行几千、几百万，甚 
至几十亿的简单算术操作，这些操作由存储的程序所规定。大槪每千分之一秒左右，汽车中 
的计算机就会从发动机中的各个传感器读取一些关键的性能指示数据，并对汽车进行微调以 
确保运转正常。该功能的关键至少有某些部分是在传感器中，计算机本身只处理电信号。= 
感器负责确定发动机究竟运转状况如何，并将这些信息转换成一组电信号，用以，述或表示 
发动机的当前状态。类似，计算机所做的调节被存储为电信号，并被转换成为发动机工作状 

况的实际变化。 _ 

电信号如何能“表示”信息？计算机如何精确地处理这些信号，以达到精细的控制而无需任 
何人的干涉？这种表示问题就是理解计算机如何工作以及如何在现实世界中部署计算机的关键。 

1.1.2 算法机 

计算机操作方面的最重要的漑念就是算法 Ulgorithmh 算法就是一个明确的、按步进行 
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的过程，用以解决某个问题或达到某个期望目标。计算机的最终定义不依赖于其物理特性, 
甚至也不依赖于其电学特性(如其晶体 管)， 而是依赖于其表示和完成算法的能力，这些算法来 
源于存储的程序。在计算机内部是数以百万计的微小电路，每个电路在被调用时都执行一个 
特定的、明确定义的任务（如将两个整数相加、使单个或一组线通电）。大多数使用计算机或 
者为计算机编程的人都不知道这些电路的工作细节。 

特别是，一个典型的计算机能执行若干个基本类型的操作。由于计算机从根本上看只是 
计算机器，所以它能执行的几乎所有功能都与数字（以及用数字表示的槪念）相关。一个计 
算机通常能执行诸如加法和除法等基本的数学操作。它也能执行基本的比较操作，如一个数 
字与另一个数字相等吗？第一个数字小干第二个数字吗？它能存储几百万或几十亿的信息片 
断，并能单独地获取。最后，它能根据获取到的信息和执行比较的结果来调整其动作。比如， 
如果获取到的值大于以前的值，則说明发动机正在过热的情况下运行，需要发一个信号来调 
节其性能。 


1.1.3 功能部件 
系统级描述 

几乎任何大学的公告板上都有这样一些广告，如“超级计算机1 3.0 -GHz Intel Celeron D , 
512 mg ，80- GB 硬驱， 15 英寸 S 示器，为抵汽车款忍痛割爱！ ”。像大多数广告一样，许多信息 
需要深入地解读才能理解其全部意思。例如，15英寸显示器的哪个部分才真正是15英寸？ 
(显示屏对角线的长度，够奇怪的了）。为了理解计算机的工作细节，我们首先必须理解主要 
的部件以及它们相互之间的关系（见图1_1)。 



阁 M —台计算机的主要硬件部件 


中央处理单元 

计算机的心脏就是中央处理单元 (Central Processing Unit ), 即 CPU 。 这通常是制造在单 
个集成电路 (Integrated Circuit , 1 C ) 硅片上的一个高密度电路（见图1-2)。它通常看起来就 
像一小块硅片，安置在一个几平方厘米并由金属管脚包围着的塑料厚片上。塑料厚片本身座 
落在一个母板 ( motherboard ) 上，母板就是一个电子电路板，由一块塑料和金厲组成，每个面 
几十平方厘米，包含了 CPU 和其他一些部件，这些部件因速度和便利等原因而需要安置在靠 
近 CPU 的地方。 CPU 是计算机的最终控制器，也是执行所有计算的地方。当然，这也是人们 
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谈论计算机时所指的部分，比如： “3.60 GHz 奔腾4计算机，如惠普 HPxw 4200”， 就是指这样 
的一台计 算机： 它的 CPU 是奔腾 4 芯片，运行速度为 3.6 千兆赫兹 ( GHz )， 即每秒3 600 000 000 
个机器周期 (machine cycle )。 计算机的多数基本操作需要一个机器周期，所以另外一种描述方 
式就是 3.60 GHz 计算机能在每秒执行超过35亿个基本操作。在写本书的时候， 3.6 GHz 是速度 
很快的机器，但随着工艺进步，情况变化很快。例如，在2000年， 1.0 GHz 奔腾是最先进的， 
根据计算能力每18个月翻一番这一长期证明有效的经验（摩尔定 律）， 我们可以预测 8 GHz 
CPU 在2008年将会普及。 



Wl -2 CPU 芯片的照片 

CPU 通常以工艺发展的系列来描述：例如，奔腾 4 是奔腾、奔腾2及奔腾3的进一步发展， 
都是 Intel 公司生产的。在这之前，奔腾本身衍生于一长率用数字编号的 Intel 芯片，开始于 Intel 
8088，并发展到80286、80386及80486。这个所谓的 “ x 86 系列”就成为锒畅销的 IBM 个人计 
算机 （ PC 机及其模仿机）的基础，并且可能是敢广泛使用的 CPU 芯片。现代苹果计算机采用 
了一个不同系列的芯片，即 PowerPCG 3 和 G 4 , 该系列芯片由苹果、 IBM 及 Motorola 组成的联 
盟 ( AIM ) 所制造。较早的苹果和 Sun 工作站采用了 Motorola 设计的68000系列芯片。 

CPU 本身可分为两个或三个主要的功能部件。控制单元 (Control Unit ) 负责在计算机内移 
动数据。例如，控制单元要从存储器中装入单个程序指令，辨别各指令的功能，并将指，传 
递到计算机的其他部分来执行。算术和逻辑单元 （ ALU ) 为计算机执行所有必需的算术运算。 
它通常包含完成加法、乘法、除法等的特殊用途硬件。顾名思义，它还执行所有的逻辑操作， 
确定一个给定的数是否大于或小于另外一个数，或者检査两个数是否相等。一些计算机（特 
别是较早的）有专用的硬件，有时安 * 在与 CPU 不同的芯片上，用于处理涉及分数和小数的 
操作。这个特殊的硬件通常称为浮点单元或 FPU (也称为浮点处理器或 FPP )。 其他计算机将 
FPU 硬件放在 ALU 和控制单元所在的同一个芯片上，但 FPU 仍可看作是 PpI — 电路系统内部的 

不同模块。 

存储器 * 

要执行的程序和其数据都存放在存储器中。在槪念上，存储器可看作是一个非常长^一 
列或一排的电磁存储器件。这些列的位置从0到 CPU 定义的最大数进行编号，可由控制单元单 
独地寻址，将数据置入存储器或将数据从存储器中取回（图卜 3 )。此外，多数的 现代^ 十算机 
都允许像磁盘驱动器这样的高速设备拷贝大块的数据而无需对每个信号都要控制单元介入。 
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存储器可宽泛地分为两种类型：只读存储器 （ ROM ), 这是永久的、不可改变的，甚至在电 
源关闭后数据仍保留，随机存取存储器 （ RAM ), 其内容可被 CPU 改变，是作为临时存储器 
但通常在电源关闭后数据消失。很多机器中同时有这两种存储器。 ROM 保存标准化的数据和 
操作系统基本版本，用于启动机器。更多程序保存在像磁盘驱动器和 CD 这样的长期存储器中， 
并在需要时被装入 RAM 中用于短期存储和执行。 

补充资料~~ 

摩尔定律 

Intel 的共同创始人戈登 • 摩尔在1965年观察到，能放置到一个芯片上的晶体管数董每 
年翻一番。在20世纪70年代，这个步伐稍徽变慢了.成为毎18个月翻一番。但令每个人包 
括摩尔博士本人吃惊的是，从此这个步伐就异乎寻常地均匀。仅仅在刚过去的几年这个步 
伐才减慢。 

更小的晶体管（相应的晶体管密度更大）所蘊涵的意义是深远的。首先，硅片本身每 
平方英寸的成本比较而言巳经相对稳定了，所以密度加倍就使芯片的成本近似减半。其次， 
更小的晶体管反应更快，并且部件能更紧密地放置在一起，所以它们能更快地相互通信， 
极大地提高了芯片速度。较小的晶体管也消粍较少的功粍，这意味着更长的电池寿命和较 
低的散热要求，避免了对房问气溫控制及庞大电廟的需求。由于更多的晶体管可放置到一 
个芯片上.就需要较少的焊接以将芯片连接到一起.因而就降低了焊接破损的机会，相应 
地也就极大地提高了总体可靠性。最后，芯片更小的事实意味着计算机本身可以做得更小， 

小到足以使嵌入式控制芯片和/或个人数字助理 ( PDA ) 这些思想成为现实。很难预测摩 
尔定律对现代计算机的发展产生多大彩响。到目前.摩尔定律通常就是简单地用来表明计 
算机的能力在每18个月翻一番（不管什么原因，不仅仅是晶体管密度）。一个当地商店下 
架的标准的、甚至低端的计算机就比1973年的原始 Cary -1 超级计算机更快、更可靠.并且 
有更多的内存。 

摩尔定律的问题是它不会永远保持。最终，物理定律指出，晶体管不能小于一个原子 
(或类似的东西）。更令人不安的是摩尔第二定律指出制造成本在每3年翻一番。只要制造 
成本增加的速度比计算机能力增长的速度慢.性能/成本比就应该保持合理。但是，投资 
新的芯片工艺的成本很大，可能会使 【 ntel 这样的制造商继续投入新的资本变得困难。 

这个简化的描述故意隐藏了存储器的一些 繁杂方 
面，通常硬件和操作系统为用户处理这些方面。（这些 
问题也趋向于与硬件相关，所以将在后面章节详细讨 
论。）例如，不同的计算机，即使有相同的 CPU , 也常 
常有不同数量的存储器。安 S 在计算机上的物理存储器 
可少干 CPU 能寻址的最多位置数，但在特定情况下，却 
可能多于 CPU 能寻址的最多位罝数。进一步地，处于 
CPU 芯片本身的存储器通常可以比处于不同芯片上的存 
储器以快得多的速度访问，所以，一个好的系统应努力 
确保数据需要移动或拷贝时能在最快的存储器中得到。 

输入/输出 （ I / O ) 外设 

除了 CPU 和存储器，一台计算机通常还包含其他 
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设备用来读、显示或存储数据，或者更一般地与外部世界交互作用。这些设备多种多样，从 
普通的键盘和硬盘驱动器，到并不普通的设备如传真 （ FAX ) 板、话筒及音乐键盘，再到相 
当怪异的小配件像化学传感器、机器人手臂及安全门拴。这些部件的一般术语就是外设 
( peripheral )。 在很大程度上，这些设备对计算机本身的体系结构和组织几乎没有直接的影响， 
它们只是信息的源点和终点。例如，键盘只是一个让计算机从用户那里获取信息的设备。从 
CPU 设计者的角度看，数据就是数据，不管它来自于因特网，来自于键盘，还是来自于奇特 
的化学频谱分析仪。 

在很多情况下，一个外设可在物理上分为两个或更多的部分。例如，计算机通常在某种 
形式的视频监视器上将其信息显示给用户。益视器 （ monitor ) 本身就是一个独立的设备，通 
过电缆连接到计算机机箱内部的视頻适配板上。 CPU 画图时，可发送命令信号给视频板，视 
频板生成图形并通过视颊电缆将适当的视觉信号发送到监视器本身。可以用类似的过程描述 
计算机如何通过一个 SCSI (Small Computer System Interface ) 控制器卡从很多不同种类的硬 
盘驱动器装入一个文件，或者通过一个以太网卡与构成因特网的数百万英里的线交互作用。 
在概念上，工程师们会对设备本身、设备电缒（通常只是一条线）及设备控制器（通常是计 
算机内部的一块板）加以区分，但对于程序员，它们通常从总体上就被看作是一个设备。根 
据这种逻辑，整个因特网连同其数百万英里的线就只是“一个设备”。对于一个设计良好的系 
统，从因特网下栽一个文件与从一个硬盘驱动器装入一个文件之间没有多大区别。 

互连和总线 

为了使数据在 CPU 、 存储器以及外设之间移动，必须存在连接。这些连接（特別是独立 
的板之间的连接）通常是成组的线，使得多个单独的信号能成组发送。例如，烺初的 IBM-PC 
有8条线在 CPU 和外设之间传递 数据。 一 台更现 代的计算机的 PCI (Peripheral Component 
Interconnect ) 总线有 64 条数据线，即使不考虑计算机速度的提高，也能使数据以8倍的速率传 
递。这些线通常组合起来形成总线 ( bus ), 总线就是连接若干不同设备的线的集合。由于总 
线是共享的（就像 早期的 共线电话），一次只有一个设备能传送数据，但连接的所有设备都可 
得到数据。一些附加信号用于确定哪个设备应该得到数据以及当它得到数据时应该做些什么。 

一般来说，连接到单个总线的设备越多，运行就越慢。这有两个原因。首先，设备越多， 
在相同时间两个设备要同时传送数据的可能性就越大，因此一个设备就要等待轮到自己传送。 
其次，史多的设备通常意味着总线£长，由于传播有延迟（即信号从线的一端到达另一端的 
时间），因而就降低了总线的速度。由于这个原因，很多计算机现在采取多总线设计，例如， 
局部总线连接 CPU 和 CPU 母板上的高速存储器（通常置于 CPU 芯片本身），系统总线连接存储 
器板、 CPU 母板以及一个“扩展总线”接口板，而扩展总线又是一个连接网络、磁盘驱动器、 
键盘及鼠标的二级总线。 

在个別的高性能计算机上（如图 1-4 所示的计算机），可能有4到5条独立的总线，一条保 
留用于髙速、数据密集的设备，如网络和视颊卡，而低速设备如键盘则归入另外的低速总线 
处理。 

支持单元 

除了已经提到的设备，一个典型的计算机还有一些对保证其物理条件很重要的部件。例 
如，在机箱内部（机箱本身也是对易损电路板的重要物理保护）有一个供电电源，用于将交 
流电压转换成可用于电路板的适当调节的直流电压。还可能有一个电池，尤其在便携式电脑 
中，用于在没有墙壁插座提供电流时提供电源并保持存储器的设置。通常还有一个风扇用来 



第一部分做想计算机 



扩展总线 


图 1-4 A 速多总线 H * 算机 的体系结构示意图 

对机箱内部通风以防止部件过热。可能还有其他一些设备，如热传感器（用于控制风扇速度〉、 
用于防止未授权的使用和拆卸的安全设备，常常还有若干个完全内部使用的外设如内部磁盘 
驱动器和 CD 阅读器。 

1.2 数字和数值表示 

1.2.1 数字表示和位 

在锒 基本的 层次，计算机部件像很多其他电子部件一样有两个 状态。 灯或者开或者关， 
开关或者打幵或者关闭，线路或者正携带电流或者未携带电流。对于计算机硬件，各个部件 
如晶体管和电阻器相对于地或者处于0电压或者处于某个其他电压（典型值是对地有5伏特电 
压）。这两个状态通常用来分別表示数字1和0。在计算机发展的早期阶段，这些值是通过翻转 
机械开关来进行手工编码的。现在，髙速晶体管实现的是几乎同样的意图，但数据用这两个 
值来表示自上世纪四十年代以来一直末改变。每个这样的1或0通常称为位或比特 （ bit )， 是 
“binary digit ” 的简写。（当然， “ bit ” 本身是一个标准的英文词，意思是“一个很小的 ft ”， 
这也描述了 “一小部分”的信息）。 

补充资料 

晶体管如何工作 

在现代计算机中最重要的电子部件是晶体管，晶体管是由 Bardeen 、 Brattain 和 
Shockley 于1947在贝尔电话实验室发明的。（这些人因为这项发明而获得了 19%年的诺贝 
尔物理学奖）。它的基本思想涉及一些相当高级的（是的，诺贝尔档次的） 董子物 理学， 
但是，不需要具体的公式，你也能根据电子迁移的原理来理解它。一个晶体管主要包含了 




























计算和表示 7 


一种称为半导体 ( semiconductor ) 的材料.它处于好导体（如铜）和坏导体/好绝缘体 
(如玻璃）之间的不稳定的中间状态。半导体的一个关鍵方面是其导电能力会隨半导体中 
杂质（掺杂物， dopant ) 的不同而显著变化。 

例如，当元素磷被加入到纯硅（一种半导体）时，将为硅提供电子。由于电子带负电. 
磷就称为 n 型 （ retype ) 掺杂物，而用磷掺杂过的硅就叫做 n 型半导体 （ n-type 
semiconductor )。 与此相反，铝是一种 p 型 ( p - type ) 掺杂物.从硅阵列中移出（实际上是 
锁定）电子。在 P 型半导体中.这些电子被移出的地方有时称为“空穴”。 

当将一块 n 型半导体与一块 P 型半导体紧挨着放在一起时（所形成的小器件称为二极管 
( diode ), 见图 1-5), 就会发生有趣的电效应。电流一般不能穿过这样的二极管，载流的电 
子将遭遇并“陷入”空穴。然而，如果你将一个偏置电压 (bias voltage ) 施加于这个器件， 
额外的电子将填充空穴.使得电流通过。这意味着电流只能在一个方向穿过二极管.使得 
其具有电整流器 （ rectifier ) 的用途。 


P ^ t •导体 n 型半导体 


二级管的结构 

—— H - 

1级管的符号 
图 1-5 二级管 

现代的晶体管做得就像一个半导体三明治.就是一个 P 型半导体薄层处于两薄片的 n 型半导 
体之间。（是的.这就是两个背靠背的二极管，见图1*6>。在常态环 境下. 电流不能从发射极 
( emitter ) 到集电极 （ collector ) 穿过，因为电子陷入到空 穴中。 将偏置电压施加到基极 （ base ) 
(中间的线）就将填充空穴使得电流能通过.你可以将基极看作一个可开关的门，使得电流能 
流过或不能通过。或者，你也可以将其看作是橡胶软管中的一个阀门，用以控制通过的水流量。 
将阀门转到一个方向，电信号就减小到很黴弱，转到另一个方向.就无阻碍地 流动。 



NPN 晶体管 



晶体管符号 


图 1-6 晶体管 
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晶体管的总体效应是（在基极）电压的小的变化将导致从发射极到集电极流过电流量 
的很大变化。这使得晶体管在放大小信号方面极为有用。晶体管还可作为二进制开关使用， 
其关键优势是没有移动部件因而不会有损坏。利用集成电路的发明. Jack Kilby 也因此赢 
得了诺贝尔奖，工程师们通过在更大硅片上利用很小块的区域而获得了生成数千、数百万、 
或数十亿微小晶体管的能力。直至现在，这仍然是制造计算机的主要方式。 


1.2.2 布尔逻辑 

现代计算机采用基于位 （ bit ) 的逻辑来操作。一个位是就是携带信息的最小单位，就像 
儿章游戏“二十个问题”中的问题，每个问题的答案为 M 是”或者“否”，这样每个问题的答 
案都可编码成一个位（例如，1表示“是”，0表示“否”）。如果你熟悉早期的 Milton Bradley 
Board 游戏“猜猜我是谁”，也是同样一个道理。如果询问是/否的问题，你就逐渐知道了你的 
对手选择了谁，并且通过记录问题的答案，你可在任何时候再现学习到的东西。因此，一个 
位就是可处理（存储、传送或操作）的最小单位。对用位表示的董进行操作的传统方式称为 
布尔 ( Boolean ) 逻辑，这是以十九世纪数学家乔治•布尔来命名的。他确定了基本的操作： 
AND (与 ）、 OR (或）和 NOT (非），并以对位的简单变化定义了它们的含义。例如，表达式 
X ANDY 为真（也可称为“是”或者1>当且仅当 X 和 Y 都为“是”。相反地，倘若表达式 X 
ORY 为“是”，只要 X 为“是”或者 Y 为“是”即可。与此等价的陈 述是： XORY 为假（“否” 
或者 0) 当且仅当 X 和 Y 都为“否”。表达式 NOT X 就是 X 的 反面： 当 X 为“否”时它为“是”， 
X 为“是”时它为“否”（见图 1-7 K 因为一个位只能处于两种状态之一，所以无需考虑其他 
的可能性。这些操作 （ AND 、 OR 及 NOT ) 可根据需要嵌套或结合。例如 ， NOT (NOT ( X )) 
就是对 X 取反后再取反，结果就是 X 本身。这三种操作与它们对应的英文词汇有很好的对应关 
系：如果我想要一杯“有牛奶和糖”的咖啡，在逻辑上，我想要的就是一杯“有牛奶”条件 
为真并且“有糖”条件为真的 咖啡。 类似地，一杯“没有牛奶或糖”的咖啡与一杯“没有牛 
奶并且没有糖”的咖啡是一个意思。（可以对这个问題多做-些考虑。） 


AND 

否 

是 

OR 

否 

是 

NOT 


否 

否 

否 

否 

否 

是 

否 

是 

是 

否 


是 

是 

是 

是 

否 


图 1-7 AND 、 OR 及 NOT 的真值表 


除了这三种基本的操作，还有根据这些基本操作定义的一些其他操作。例如， NAND 是 
NOT - AND 的 缩写。 表达式 X NAND Y 就是指 NOT ( XANDY )。 类似地 ，X NOR Y 就是指 NOT 
( XORY )。 另一个常见的表达式是异或 ( exclusive - OR ), 写成 XOR 。 表达式 X OR Y 为真，则 
X 为真，或 Y 为真，或者两者都为真。对比之下， XXORY 为真，则 X 为真，或 Y 为真，但不能 
两者都为真。这个差异在英文中没有明确地表达出来，而隐含在一些不同的用法中。例如，如 
果我被问到我的咖啡中是否需要牛奶或糖，我可能说“好的”，意思是我两者都要。这是正常 
的 ( inclusive ) OR 的意思。与此不同的是，如果问我要咖啡还是茶，我若说“好的”来表示两 
者都要就不很恰当。这是一个 ( exclusive ) OR , 我能要咖啡 XOR 茶，但不能同时两者都要。 

从严格的理论观点看，将1/ “是” / “真”编码为地电压还是编码为对地5伏电压没有多大关 
系，只要将0/ “否” / “假”总是编码成与之不同的值即可。从计算机工程师或系统设计者的观 
点看，就可能有特定的原因（如功耗）来选择一种表示而不选择另一种。表示法的选择对芯片 
设计本身会有深远的影响。上面描述的布尔操作通常在芯片非常低的层次上用硬件实现。例如， 
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我们可以用一对开关（晶体管）建立一个简单的电路，使得只有在两个开关都关闭的情况下电 
流才能流过。这样一个电路称为与 ( AND ) H , 因为它对表示成开关状态的2个位实现了 AND 
的功能。这个微小电路与其他类似的电路 （ OR 门， NAND 门等等）一样，在计算机芯片上要复 
制几百万或几十亿次，是计算机的基本构件块。（关于这些门如何工作的更多信息参见附录八。） 

1.2.3 字节和字 

为方便起见，8个位通常组合成一块，传统上称为字节 （ byte )。 这样做主要有两个优势。 
首先，对于人来说，读写一个长长的0/1序列很乏味且容易出错。其次，大多数有意义的计算都 
要求多位的数据。如果有像标准总线那样的多条线，则电信号可成组移动，实现更快的计算。 

下一个命名位块称为字 （ wordh 字的定义和大小不是绝对的，而是随计算机的不同而变 
化。一个字就是计算机最便于处理的数据块大小。（虽然不总是如此，但通常都是通向主存储 
器的总线大小。但是后面要讨论的 Intel 8088是一个反例。）例如 ， Zilog Z -80 微处理器（作为 
Radio Shack TRS -80 的基础芯片，在20世纪七十年代中期流行）的字大小是8位，即一个字节。 
CPU 、 存储器及总线都已优化为一次处理8位。（例如，系统总线中有8条数据线）。当计算机 
必须要处理16位数据时，就要分两部分分别处理。而如果计算机只有4位数据要处理时 ， CPU 
就像处理8位数据一样工作，然后抛弃额外4个无用的位 • 原始的 IBM PC 是基于 Intel 8088芯片 
的，有16位大小的字。更现代的计算机如 Intel 奔腾 4 或者 PowerPC G 4 有32位大小的字。有64 
位或更大字的计算机如 Intel Itanium 和 AMD Operon 系列也已经出现了。尤其对于高端科学计 
算或图形学，如家庭视颊游戏控制台，字的大小会成为能否以足够快的速度传送数据以支持 
平滑变化的髙精细度图形的关键。 

正式地讲，计算机字的大小定义为其寄存器 （ register ) 的大小（用位数表示）。寄存器是 
CPU 内部实际进行如加、减、及比较等计算的存储位置（图1-8>。寄存器的数量、类型及组织对 
于不同的芯片变化很大，甚至对同一系列的芯片变化也会很大*例如 ， Intel 8088有4个16位通用 
寄存器，而7年后设计的 Intel 80386则采用了32位寄存器。对寄存器高效的利用是编写快速、优 
化的程序的关键。遗憾的是，由于不同计算机之间存在差异，使得这成为比较困难的一个方面。 


算术和$辑单元 （ ALU ) 


程序 计数器 ( PC ) 


指令寄存器 （ IR > 


控制单元 ( CU ) 


总线 

图 1-8 CPU 的典型内部结构 
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1.2.4 表示 

位 模式的解释是任意的 

首先考虑一下老式的8位微计算机芯片中的寄存器。它能保存多少种不同的模式呢？对这 
个问题的另一种问 法是： 按正反面排列8个便士硬币的序列有多少种方式，或者，分别是0或1 
的8个数字能构成多少种串。 

对于第一个位/硬币/数字有两种可能性，对第二个也有两种可能性，这样一直下去直到我们 
达到第8位即最后一位数字。这样就有2 -2-2.2-2-2-2- 2种可能性，算出来就是2 8 = 64种 
不同的存储模式。类似的推算显示出，对于32位寄存器，存在2 32 即刚好超过40亿种存储模式。 
(的确，对于过分苛刻的人来说应该是2 32 =4 294 967 296。处理大的二进制幂的一个有用经验是 
2 lG 虽然真实值是1024,但十分接近于1000。回忆一下，数的相乘可通过指数相加 实现： a b . 
a c = a k 。 这样，2 32 就是即2 2 . 2 ,0 • 2 • 10 • 2 • 也就是大约4 • 1000 • 1000 • 1000。） 

但是这些模式意味着什么呢？实际的答 案是： 要由程序员来决定它们意味什么。在下一 
个小节你将会看到，可以将位模式00101101解释为数字77。也有可能解释成8个不同的是/否 
问题的答案。（“你结婚了吗？” 一没有。“你过了25岁了吗？” -没有。 44 你是男性吗？” 一是。 
如此等等。）它也可以表示键盘上所按下的键（在这种情况下，这个模式就表示大写的 M 的 
ASCII 值）。对位模式的解释是任意的，对同一种模式，计算机可以有很多种使用方式。程序 
员的一部分任务就是确保计算机总是能正确地解释这些任意的、意义含糊的模式。 

自然数 

解释位模式的常用方式涉及二进制 （ binary ) 算术运算（基数为2)。在传统的十进制 
( decimal ) 运算（基数为 10) 中，只有从0到9这十个不同的数字符号。更大的数就表示为单 
独的数位乘以某个基数值的幕。例如，数字481就表示为4 • 10^ + 8- 10' + 1 0 采用这种表示法， 
我们只用三位十进制数字就能表示999以内的所有自然数。采用类似的表示法，但用2的幂累 
加，我们就能用0和1表示任何二进制数。 

以十进制数85作为例子，通过简单的运算显示出该数等干64+16 + 4+1,更详细地写成1 • 
2 6 + 0 . 2 5 +1 • 2 4 +0 . 2 3 +1 • 2 2 +0 • 2>1。采用二进制，这个数就写成1010101。用8位寄存器， 
这个数可存储为01010101,而用32位寄存器，将成为000000000 000000000 0000000 1010 101。 

可以在这些二进制数上进行算术运算，所采用的策略和算法与小学生解决10进制问题一 
样。亊实上，二迸制运算甚至更容易，因为加法和乘法表更小而且简单得多！因为只有0和1 
两个数字，所以表中只有四项，如图 1-9 所示。只要记住，当进行二进制加法（基数为 2) 时， 
只要得到结果2就产生一个进位（就像在十进制 + 0 1 

中每次得到结果10就产生一个进位一样 ） 。这样， — - 5—7 

在基数为2时，1 + 1的结果不是2,而是0并有进 〗1 10 

位行观察，可以发现二进制运»即 -9二 进制（基数为 2) 运算的加法和乘法表 

和布尔代数之间的本质联系。乘法表与 AND 是一样的。当然加法可能产生两个数：和与（可 
能的）进位。进位存在的充分必要条件是第一个数字和第二个数字均是1。换句话说，进位也 
就是两个加数的 AND , 而和（不包括进位）是1的条件是第一个数字是1或者第二个数字是1， 
但不能都是1，也就是两个加数的 XOR 。 通过建立适当的 AND 和 XOR 门，计算机就能在寄存 
器的表示能力范围内对任何数字进行加法和乘法操作。 

那么，一个8位寄存器能存储多大的数字呢？最小的可能值显然是00000000,代表数字0。 
最大的可能值就是 Ullim , 代表255。任何在这个范围的整数都可以容易地表示成8位的量。 
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对于32位寄存器，最小的值仍然是0,但最大的值刚好超过42亿。 

虽然计算机解释长的二进制数没有困难，但对人类来说往往有困难。例如，32位数字 
00010000000000000000100000000000 与数字（做一下深呼吸）0001 0000 00000 
0000001000000000000是一样的吗？（不，它们是不同的。第一个数的两个1之间有16个0, 
而第二个数的两个1之间有15个0。）因为这个原因，当有必要处理二进制数字时（希望这种情 
况很少），多数程序员宁愿使用十六进制 ( hexadecimal ) (基数为 16) 数字来代替。由于16 = 
2 4 ,每个4位的块（有时称为半字节 （ nybble )) 可表示成一个基数为16的“数字”。在16个十 
六进制数字中，我们熟悉其中0到9这10个数字，表示0000到1001等模式。由于我们日常的十 
进制数只使用10个数字，计算机科学家就增选字母 A 到 F 来代表其余的模式 (1010 , 101 ], 
1100 , 1101，1110, 1111,全部的转换列表见表1-1)。目前，这几乎是人们对十六进制数的 
唯一使用 方式： 用于指定和简写（比如密码学或网络中可能用到的）长的位串值。上面两个 
数转换成基数为16时明显有所 不同： 


0001 

1 

0000 

0 

0000 

0 

0000 0000 

0 0 

1000 

8 

0000 

0 

0000 

0 

= 0 x 10000800 

0001 

1 

0000 

0 

0000 

0 

0000 0001 

0 1 

0000 

0 

0000 

0 

0000 

0 

= 0 x 10001000 


表 1-1 十六进制《二进制数字的转换 


十六进制 二进制 十六进制 二进制 十六进制 二进制 十六进制 二进制 


0 

000() 

4 

0100 

8 

1000 

c 

1100 

1 

0001 

5 

0101 

9 

1001 

D 

1101 

2 

0010 

6 

0110 

A 

1010 

E 

1110 

3 

0011 

7 

0111 

B 

1011 

F 

1111 


根据很多计算机语言（包括 Java 、 C 、 及 C ++) 的惯例，写十六进制数时用 “ Ox ” 或 “0 X ” 
开头。我们在这里遵循这个惯例，这样数字1001就是指十进制数1001。值(^1001就娃指16 3 + 
1,就是十进制值4097。（本书中的那些二进制量很好辨別。另外，在很少的情况下，一些模 
式写成8进制 （ octal ) 数字，即基数为8。在 C 、 C ++、或 Java 中，这些数字用0开头，数字 
01001作为八进制数就等价于513。这是一个不太走运的惯例，因为几乎没人出于某种理由使 
用八进制，但传统如此。）注意不论 ft 数是什么，0还是0 (1 也还是1)。 

基数转换 

从一种基数表示转换到另一种表示可能很乏味但却是必要的事情。幸运的是，所涉及的 
数学知识相当简单。例如，如果你理解了表示方法，从其他任何进制转换到十进制就很简单。 
例如，二进制数110110就表示 2 5 + 2 4 + 2 2 + 2 i , 就是32+16 + 4 + 2,得54。类似地， 0 x 481 就 
是4 • 16 2 + 8. 161 + 1,就是 1024+128+1,即十进制数 1153。 

完成计算的一种更简单的方式是交替进行乘法和加法。二进制数110110显然是二进制值 
11011的2倍。（如果不是显然的，就注意一下十进制数5280是值528的10 倍）。 接下来二进制数 
11011又是1101的2倍再加1。这样，简单地交替乘以基数值和加1就行了。采用这种方法，二 
进制110110就 成为： 

((((((((((1 • 2 ) + 1 ) • 2 ) + 0 ) • 2 )+ 1 ) • 2 ) + 1 ) • 2 ) + 0 ) 

简单计算证实得数是54。类似地， 0 x 481 是： 
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((((4 - 16) + 8) - 16) + 1) 





这样，二进制数 looioiionooioi 就分解成4位一组的半字节，从右开始，就是 loo ion 
0110 0101。（请注意我偷懶了，我给你的数只有15位，所以有一个4位组是不全的。这个组总 
是在最左端，要用0来填补，所以你需要转换的真正值是0100 1011 0110 0101。）如果在表中 
査这四个值，你会发现它们对应干4、 B 、 6及5。因此，相应的十六进制数就是 0 X 4 B 65。 

从相反方向，十六进制数 Oxl 8 C 3 可转化为四个二进制数组0001 (1)、1000 (8)、1100 
( C ) 及0011 (3)，放在一起就得出0001100011000011。 

类似的技术也适用于八进制（基数 8), 对应于表 1-1 的前两列并只使用最后3个（而不是4 
个）数字，如表 1-3 所示。采用这些表示方法和技术，你就能在一个足够大的寄存器中表示任 


逬制 


进制 十六进制 


六 进制 


十六进制 


可求得值为1153。 

如果交替进行乘法和加法就能转换为十进制数，厢理成章地，交替进行除法和减法就能 
将十进制数转换到二进制数。在我们进行除法操作时，减法实际上是隐含的。当一个整数除 
以另一个整数时，很少得到除尽的答案。一般会有一个余数，这个余数必须隐含地从被除数 
中减去。这些余数就是得数。再以54为例，我们重复地除以2就产生所需要的二进制 数字： 

54+ 2 = 27 余 0 
27 + 2=13 余 1 
13 + 2 = 6 余 1 
6 + 2 = 3 余 0 
3 + 2=1 余 1 
1+2 = 0 余 1 

黑体数字当然就是54相应二进制数各位上的数（二进制数〖10110)。仅有的棘手事情就是 
要记住，在乘法进行过程中，数字是按正常顺序（从左到右）进入的，所以并不奇怪，在除 
法过程中，数字是按反向从右到左的顺序出来的。这个过程对基数为16 (或者基数为8,基数 
为4,或者任意基数）也 适用： 

1153+16 = 72余 1 
72+16 = 4余8 
4+16 = 0余 4 

敁后，坫常用同时也许是垴®要的转换是直接（并且快 速地） 在二进制和十六进制之间 
进行转换，不管按哪个方向。幸运的是，这也是燉容易的。因为16是2的4次幕，乘以16实际 
上就是乘以2 4 。这样，每个十六进制数字就直接对应一组4位二进制数字。就像较早讨论过的， 
要从十六进制转换到二进制，只要简单地将每个数字替换成等价的4位二进制数字即可。要从 
二进制转换到十六进制 （ hex ), 就要将二进制分裂成4位的若干个组（从右边开始），并按反 
方向完成替换操作。全部的转换如表 1-2 所示。 

表 1-2 十六进制〜二进制《字转换（表 1-1 的 拷贝） 


ooooolli 











带符号表示 

在真实世界中，常常使用负数。如果存储在寄存器中的最小可能值是0,那么，计算机如 
何存储负数值呢？这个相当奇怪的问題不是存储的问题而是解释的问题。虽然对于给定的寄 
存器大小可存储的最大模式数是固定的，但程序员可以将一些模式解释为负数值。通常的方 
法是采用一种称为二进制补码表示 （ two’s complement notation ) 的解释方式。 

通常人们认为，如果你倒车（甚至电影《春天不是读书天 》 (Ferris Beuller’s Day off ) 中 
也这么认为），里程表会反转而且显然会让发动机取消几英里。我不知道是否会这样，对 Ferris 
并非如此，但 Howstuffworks . com e 说应 
该这样。暂时想象会这样。假设我取来 
一辆相对较新的车（比方说，有了 10英 
里的里程），并将其倒退行驶11英里。里 
程表会显示什么呢？ 

可是，里程表不会显示是 I 英里”。 

超过000, 000后，它可能会显示999, 999 
英里。但是，如果我再向前行驶1英里， 

里程表就又会转到000, 000。我们可以 
隐含地将 -1 定义为这样一个数字：当1 
加上它时，结果为0。 

这就是二进制补码表示法的原理。 

负数是从全0的寄存器开始通过向反方 
向计数（采用二进制）来产生和处理的， 

如图 1-10 所示。首位是0的数被解释为 图】 4 位带符号整数表示的结构 

正数（或0)，而首位是1的数被解释为 

负数。例如，数13写成8位二进制数为00001101 (是十六进制数 OxOD ), 而数一 13是11110011 
(0 xF 3)。 这些模式称为带符号 （ signed ) 数，以区别于先前定义的无符号 （ unsigned ) 数。特 
别是，模式 0 xF 3 是 -13 的二进制补码表示（在8位寄存器中）。 

我们如何才能从 0 xF 3 得到-13呢？除了 1打头，显然两种表示之间不存在相似性。两者之 
间的关系相当微妙，这是建立在上面所定义的负数是正数取反这一基础上的。就是说，13 + 
- 13应该为0。采用上面的二进制表示，我们注 意到： 



八进制 


八进制 


何非负的整数，并用我们讨论过的任何基数来解释。发挥一点创造性和才能，你甚至能使这 
些技术运用于象3或7这样怪异的基数。 

表 1-3 八进制一二进制数转换 



0 http://auto Jiowstuffworks .com/odometer 1 .thm 。 
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-13 用二进制补码表示 
0加上一个溢出/进位 

然而，9位的董100000000 (0 x 100) 无法存储在一个8位寄存器中！就像当英里里程数变 
得过大时汽车里程表超过限度一样，8位寄存器也会溢出 ( overflow ) 并丢失包含在第九位的 
信息。这样就导致所存储的模式是00000000,即 0 x00 , 也就是二进制（十六进制也是 ） 0。采 
用这个方法，我们就能看到，存储在8位寄存器中的值的范围是从-〗28 (0 x 80) 到+ 127 
(0 x 7 F )。 大槪一半值是正数，一半值是负数，这就是人们一般所想要的。图 1-10 显示，一般 
情况是，负数比正数多一个，因为图中0对面的数是负数。 

这个展示非常依赖于使用8位寄存器。对于一个32位寄存器，就需要更大的值来产生溢出 
并循环回到0。 -13 的32位二进制补码表示不是 0 xF 3, 而是 0 xFFFFFFF 3。 事实上， 0 xF 3 若被看 
作是一个32位的数，则通常被解释成 OxOOOOOOF 3, 它甚至不是负数， 因为它的 首位数字不是1。 

手工计算一个数的二进制补码表示（对于固定的寄存器大小）并不困难。首先注意到， 
对干任何大小的寄存器，- 1的表示都是寄存器所有的位均为1。向这个数加1将产生溢出并使 
寄存器的所有位均为0。对于任意给定的位模式，如果你对每个位进行反转（每个1变成0,每 
个0变成1，并保持原来的顺序。这个操作有时被称为按位 （ bitwise ) 取反 ( NOT )， 因为它将 
NOT 操作施加于每个位），并将得到的数再加上原来的数，得到的结果就是寄存器所有的位均 
为1。（为什么？）这个反转的模式（有时称为“ I 补码”或者称为“反码”）加到原来的模式， 
产生的和为- 1。 当然，再加上 1 就得到-1 + 1， 即 0。 这个反转的模式加 1 就得到原数的二进 
制补码。 


00001101 
+ 11110011 


100000000 


00001101 (■ 13 ) 

11110010 (按位取反> 


11110611 (- - 13 ) 

注意，再*复这个过程一次就使反转值再反转一次。 

11110011 (■ - 13 ) 

00001100 (按位取反） 


00001101 (■ 13 ) 


这个过程可推广到任何数和任何（正数）寄存器大小。减法以同样方式进行，因为减去 
一个数就等同干加上这个数的负数。 

浮点表示 

除了表示有符号整数，还常常要求计算机表示小数或者带小数点的*。为做到这一点， 
可对标准的科学记数法进行修改，采用基于2的幂代替基干10的幕。这些数通常称为浮点 
( floatingpoint ) 数，因为根据这种表示方式，它们包含可浮动的小数点。 

从基本的数开始，显然任何整数都可通过增加一个小数点和很多个0的办法转换为带小数 
点的数。例如，整数5就变成 5.000..., 整数-22就变成 -22.0000 …，等等。对其他进制数也 
是这样（只不过从技术上讲小数 ( decimal ) 点针对十进制，而对其他基数则称为小数 （ radix ) 
点）。这样，二进制数1010转换成小数就是 1010.0000 …，而十六进制数 0 x 357 转换成小数就是 
0 x 357.0000 
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任何带小数点的数都可通过移动小数点并乘以若干次基数而写成科学记数的形式。例如, 
阿伏加，罗数通常近似为 6.023 • 10' 即便是忘记了它在化学中的重要性的学生也应能解释 
这种表示。阿伏加德罗数是一个24位 （23+1) 的数，其起始的四位数字是6, 0, 2, 3,大约为 
602 300 000 000 000 000 000 000。科学记数法有三个 部分： 基数 (base ) (在本例中是 10), 
指数 （ exponent ) (23) 及尾数 （ mantissa) (6.023)。为解释这个数，就要对基数求指数次的 
幂并与尾数乘。显然，有很多种不同的尾数/指数对能产生相同的数。阿伏加德罗数也可写成 
6023 • 10 20 、60.23 . 10 22 或者甚至是 0.6023 • 10' 

计算机可采用同样的思想，但要用二进制表示。特别地要注意表 1-4 的模式。一个数乘以 
2就将其左移1位，除以2就将其右移1 位。 采用科学记数法形式也按同样的位模式移动（指数 
要适当调 整）， 如表 1-4 所示。 



表 1*4 

二进制数的指数表示 


十进制数 

:进制整数 

二进制小数 

科学记数法 

5 

10 

20 

40 

00000101 

00001010 

00010100 

00101000 

00000101.0000... 

00001010.0000 … 

00010100.0000 … 

00101000.0000 … 

1.01 (binary) - 2 J 

1.01(binary) - 2 5 

1.01 (binary) • 2 * 

1.01 (binary) - 2 5 


我们将这种方法进行扩展来表示二进制的非整数浮点数，如表 1-5 所示 p 例如，数 2.5 是5 
的一半，可表示成二进制最 10.1 或者二进制 ftl.Ol 乘以2 1 。那么， 1.25 就是二进制 1.01 或者 
1.01 乘以2%用这种表示，任何十进制浮 点歎都 有一个等价的二进制表示。 


表 1-5 二进制小数的指数表示 


十进制数 

二进制数 

二进制实败 

科学 id 数法 



00101.000... 




00010.100... 




00001.010... 







电气和电子工程师协会 （IEEE) 已经发布了一系列的规范文献，描述了用二进制表示浮 
点数的标准方式。其中一个标准 IEEE 75 4 - 1985就描述了将浮点数存储成32位字的方法，如 
下所示 （如图 1-11 所示 h 



图 1-11 IEEE 32位浮点 存储： 符号、指数、尾数 


对字的32位编号，最左端为第31位，最右端是第0位。首位（第31位）是符号 （sign) 位, 
表明这个数是正数还是负数。与二进制补码的表示不同，这个符号位是能显示量值相同的两 
个不同数的唯一方式。 

再往后的8个位（第 30-23 位）是“偏置的”指数 （ exponent)。 要是用位模式00000000 
来代表2°,用位模式00000001来代表21是可以的，但是，那样的话我们就不能表示象 0.125 ( 2 ^) 
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这样的小数值。用8位二进制补码表示也是有意义的，但 IEEE 也没有这样选择。 IEEE 选择的 
是采用无符号数0…255,但存储在指数位（表现指数）的数是一个“偏置的”指数，实际值 
比“真实”指数大127。换句话说，一个实际为0的指数被存储为表现指数127 (二进制 
01111111)。一个实际为1的指数将被存储为表现指数128 (二进制 10000000), 而存储成 
00000000的指数实际代表的是很小的董2-〃 7 。其余的23位（第22 - 0位）是带小数点 
(decimal point ) (技术上称为小数点 （radix point ), 因为我们再也不用处理十进制了）的尾数， 
传统上被放置在紧跟第一位二进制数的后面。这个格式在小数点前面有固定位数，有时称为 
范式 （normalized form ) 0 

这样，对干常规的数，存储在寄存器中的值 就是： 

(- 1) 符号位. 尾数. 2#实指数 *127 

表现指数为127就意味着尾数乘以1 (相应 的真实指数是0。所以乘数是 2 C ), 而表现指数 
为126就意味着小数乘以2- 1 即 0.5, 依此类推。 

实际上，上式中有一个小小的 陷阱。 因为数是二进制表示的，第1个非零数字必须是1 
(如果不是0没有其他的选择！）。由于知道第一位数字是1，我们就能将其略去以便利用节省 
下来的空间来存储我们预先不知道的其他 数字。 所以，真实公式应 该是： 

(一】） W 号位. 1. 尾数. 2*实指数 + 127 

作为一个简单的例子，十进制数 2.0 用二进制表示是 L 0.2 1 。 将这个数表示成一个 IEEEff - 
点数，符号位是0 (是-个正 数）， 尾数全是0 (还有一个隐含的首位 1), 指数是127+1，即 
128,也就是二进制数10000000。这将会以32 位的址 存储。 

0 10000000 00000000000000000000000 

符号 指数 尾数 

这个位模式可写成十六进制数 0 x 40000000, 

另一方面，数 -1.0 的符号位为1,指数为127 + 0,即二进制数01111111,尾数全是0 ( 加 
上一个隐含的首位1)。这将产生下面的32 位量： 

1 01111111 00000000000000000000060 

符号 指数 尾数 

这个位模式的另一种写法是 0 xBF 800000, 

这里还有个小问如果要存储的数就是 0.000 …你会怎么办?在一串0中没有任何地方放 
置“隐含的首位1”。作为一个特殊情况， IEEE 定义所有位全是0 (符号、指数、尾数）的位模 
式表示数0.0。还有一些其他的特殊情况，包括正和负的无穷大，还有所谓的 NaN (不是 一个 
数，这是当你试图做一个非法操作如对负数求对数值时所产生的结果），以及用来以极大的精 
确度表示极小数（但很少使用）的“非规范化数”。 IEEE 还为在64位和更大的寄存器中更准确 
地存储数定义了标准方法。对于上面描述的32位标准，这些额外的情况尽管在细节上不同， 
在本质上是类似的。但细节相当枯燥和技术化，不要求一般程序员掌握。 

在任何基于基数的表示中都会出现一个问题，会有一些不能准确表示的数。即使不用担 
心无理数（如 H ), —些分数也不能准确表示。例如，在基数为10时，分数1/7有近似值 
0.14285714285714 …但永 远不会结束。分数1/3也类似，它的值为 0.33333 …。在基数为2时，分 
数1/3是 0.010101010101010101 …但无法将一个无穷的序列放入到23个尾数位中。所以，解决 
方法 就是： 我们不这样做。 

我们采取的方法是尽可能地接近原来的值。转换成小数后，我们看到1/3大槪等于 
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1.01010101010101010101010 • 2_ 2 ,表示成： 

0 01111101 01010101010101010101010 
符号 指数 尾数 

这不是一个完美的表示，但它是接近的。“接近”可能并非在所有情况下都足够好。小的 
误差（称为舍入误差 （roundoff error)) 将不可避免地进入到涉及浮点数的计算中。如果将这 
个数乘以3 (1.1 -2>),不太可能得到准确的 1.0 这个值。程序员们，尤其是那些处理矩阵求逆 
之类大数值计算的程序员们，要花费很多时间来努力使这种误差最小化。现在，我们能做的 
就是要知道有这个问题。 

对浮点数执行操作是竦手的（而且常常很慢）。直观上看，所采用的算法是可以理解的， 
并且非常类似于你已知道的科学计数法表示的数的操作。乘法相对容易，因为我们知道2*乘 
以就是2〜。因此，对两个浮点数求乘积，结果的符号位就是两个数的符号位的积或者异或 
(XOR), 尾数就是两个数的尾数的乘积，而指数就是两个数指数的和 e 。 这样，我们就有下 
面的 例子： 

3.0 = (0) (10000000) (100000000000000000000000) 10x40400000] 

2.5 = (0) (10000000) (010600000000000000000000) [0x40200000] 

3.0 • 2.5 的结果的符号位就是0,尾数就是 1.100 … • 1.010 …，即 1.111... (你明白为什么 
吗？）。最后，指数就是1 + 1 =2,表示成1000001。这样，乘积 就是： 

(0) (10000001) (111000000000000000000000) [0X40F00000] 

正如所预期的，这个数转换后就是7.5。 

加法要困难得多，因为只有两个数的指数相同时加法才能进行。如果两个相加的数的指 
数相同，则将其尾数相加就（几 乎） 足够了： 

3.0 = (0) (10000000) (100000000000000000000000) [0x40400000] 

2.5 = (0) (10000000) (010000000000000000000000) [0x40200000] 

二进制数 1.01 加上 1.1 得 10.11, 所以答案就是 10.11 乘以共同的指数 部分： 10.11 得到 
的结 果是： 

(0) (10000001) (011000000000000000000000) [0X40B00000] 

转换后，正如预期，得到结果5.5。 

然而，当两个指数不相同时（例如，当将 2.5 和 7.5 相加时），就要将一个加数转换成与另 
一个加数的指数相同的等价形式： 

2.5 = (0) (10000000) (010000000000000000000000) (0x40200000] 

7.5 = (0) (10000001) (111000000000000000000000) [0X40F00000J 

下面来转换 7.5: 1.111 . 2 2 与 11.11 • 2 1 等价。 11.11 + 1.01 得 101.00。 101.00 2 1 等价于 
1.01 - 2 \ 最终结果就是： 

(0) (10000010) (010000000000000000000000) [0x41200000) 

也正如所预期的，这个值是10.0。 

字符表示 

非数值数据如字符和字符串也按二进制数来处理，只是程序员/用户对它们的解释不同。 
存储字符最常用的标准是 ASCII 码，字面意思是美国信息交换标准码 (American Standard 


0但记住，要考虑到指数的偏差以及尾数头部上没有表示出来的那个 U 
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Code for Information Interchange )。 ASCII 码将特定字符分配到 0 到 127 之间的各个数。 

这有点过于简化了。从技术上说， ASCII 码为0000000到1111111之间（包括这两个数）的 
每个7位二进制模式提供了一个解释。其中的很多模式被解释成字符。例如，模式1000001是 
一个大写的 4 A ’。 一些二进制串，尤其是 ooooooo 到 ooimi 之间的那些串被解释成“控制字 
符”，如回车，或者到外设的命令如“标题开始”或“传输结束”。由于几乎所有的计算机都 
是面向字节的，所以多数计算机不是将 ASCII 字符存储成7位的模式，而是存储成8位的模式， 
首位是1。例如，字母 A 就是二进制01000001,也就是十六进制 0 x 41, 或者说是十进制65。采 
用8位存储就使得计算机能利用额外的（高位）模式进行字符集扩展。例如，在微软的 
Windows 中，几乎每个字符集都有128-255范围内的不同显示值。这些显示值可能包括图形 
字符、扑克牌花色、带区分标记的外文字符，等等。 

ASCII 编码的主要优势是每个字符都很宽裕地对应一个字节。 ASCII 的主要缺 点是： 由于 
它是美国的标准码，所以不能很好地反映世界范围内字母表和字母的变化。随着因特网不断 
地将不同国家和讲不同语言的人们连接在一起，&然就需要有对非英语（或者说，非美国） 
字符的编码方法。这就出现了 Unicode 共同体发布的 UTF -16 编码。 

UTF -16 采用两个字节 （16 位）来存储每个字符。前128个模式几乎与 ASCII 码一样。然而， 
由于有16位，就有超过65 000 (在技术上是65 536) 个不同的模式，每个模式可分配一个单独 
的（可打印）字符。这个巨大的字符集合就使得对用多种字母表写成的文档进行统一、可移 
植的方式处理成为可能，这些字母表包括：（美国）英语，不常见的字符如音标（如 a 0 和货 
币符号，拉丁字母表的变型如法语和德语，以及（从美国计算机科学家的角度看）不常见的 
字母表如希腊语、希伯来语、西里尔语（用于俄语）、泰语、切罗基语以及西藏语。例如，希 
腊语大写字母 psi ( V )就是用 0 x 803 A , 即二进制数1000000000111010来表示 * 即使是对汉语/ 
日语/朝鲜语这样的象形文字集合（包含的字符超过40 000 个） 也能表示（见图 M 2 的例子）。 

机器操作表示 

除了存储很多不同类型的数据，计算机还需要存储可执行的程序代码。如同我们讨论过 
的所有其他模式一样，在最基本的级別上，计算机只能解释二进制的活动模式。这些模式通 
常称为机器语言 （machine language ) 指令。寄存器在 CPU 中的主要角色之一就是取出并保存 
一个位模式，这个位模式可被译码成为机器指令然后执行。 

机器语言的解释一般是困难的并且在计算机之间变化极大。对于任意给定的计算机，指 
令集 (instruction set ) 定义了计算机能执行哪些操作。例如， Java 虚拟机 ( JVM ) 有一个相对 
小的指令集，只有256种可能的操作。每个字节就可解释成要采取的可能动作。值89 (0 x 89) 
对应于 dup 指令，该指令导致计算机对存储在 CPU 中的特定部分信息进行复制。值 M 6 (0 x 92) 
对应于 12 c 指令，该指令将一个32位的量（通常是整数）转换成一个16位的量（通常是一个统 
一编码的字符）。这些数字到指令的对应关系特定于 JVM ， 对奔腾4或 PowerPC 是不适用的， 
这两种 CPU 有其特定的指令集。 

为完成 某个任 务而生成机器码常常是极为费力的工作。计算机通常为该任务提供大强度 
的编程支持。程序员通常用某种人可读的语言写程序，然后采用如编译器这样的程序将该语 
言转换成机器码。编译器本质上就是将人可读的语言转换成机器语言的程序。 

解释 

根据我们在前面部分所学到的知识，显然任何位模式都几乎能以几种不同的方式进行解释。 
一个给定的32位模式可能是一个浮点数、两个 UTP -16 字符、几条机器指令、两个16位整数、 
一个无符号32位整数或很多其他可能性（见图1-12)。计算机如何区分两个相同的位串呢？ 
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解释为 


十六进制数 
带符号32 位螫数 
带符号16 位聱数 
带符号32位浮点数 
8位字符 
16位字符 
JVM 机器指令 
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图 1-12 位模式的多种解释 


简单的答案是它不能区分，这会存在 误导。 较长但更有用的答案是对位串的区分是由程 
序指令的上下文来提供的。我们将在接下来的章节中讨论到，多数计算机（包括已讨论过的 
主要计算机 JVM) 都有若干不同种类的指令做着大致相同的事情。例如， JVM 就有不同的指 
令来完成32位整数、64位整数、32位浮点数、64位浮点数的加法操作。这些指令隐含认为要 
相加的位模式就是适当的类型。如果你的程序装入两个整数到寄存器中，然后告诉计算机做 
两个浮点数的加法操作，计算机就会天真而无辜地将两个整数位模式当作浮点数处理，将它 
们相加，得到无意义而且完全错误的结果。（图 M2 表明了这一点，因为该模式中所隐含的指 
令在类型上是非法的。）类似地，如果你告诉一个计算机将一个浮点数作为一个机器代码来执 
行，计算机就会尽嵌大能力地来执行，不管这个数对应了多么愚蠢的指令。如果你幸运的话， 
这只不过会使你的程序崩潘。如果你不走运，…那么，这就是黑客佼入计算机的主要途径之 
一： 通过使缓冲器溢出并用他们自己的指令覆盖可执行代码。 

某种类型被肴作另外不同的类型来使用几乎总是会出错。不幸的是，这种错误计算机只 
能郎分地弥补。敢终，确保数据正确存储和位模式正确解释要由程序员（以及编译器编写者） 
负贵。 JVM 的主要优势之一就是它能捕获这些 错误。 

1.3 虚拟机 
1.3.1 什么是虚拟机 

由于指令集之间的差异，那么，就很有可能（提醒：这是一个相当保守的说法）使得为一 
个特定的平台 （CPU 类型和/或操作系统）所写的程序不能运行在不同的平台上。这就是为什 
么软件发行商为使用奔腾 4 CPU 的 Windows 计算机和使用 PowerPC CPU 的 Macintosh 计算机卖出 
不同版本的程序，也就是为什么很多程序有“最低配置”，即某个特定的计算机必须有一定的 
存储容量或某种特别的视频卡才能正常工作。在极端情况下，这就要求计算机程序员独立地从 
头开始写相关的程序（比如同一个游戏的 Mac 和 Windows 版本），这实质上是一个使程序开发的 
时间、精力以及成本都加倍的过程。幸运的是，很少需要如此。多数的编程是用所谓的高级语 
言 (high-level language) 如 C、 C++、或 Java 来完成的，然后人可读的程序源码再由另外一个 
程序如编译器转换成可执行的机器码。只有少部分的程序一如嵌入式系统、需要直接硬件访 
问的图形功能或者控制非一般外设的设备驱动器，才需要用机器特定的语言来编写。 

Java 的设计者意识到了 Web 的普及性以及需要在任何地方都能运行可编程 Web 页面，因此 
采取了不同的途径。 Java 本身是一个髙级语言。 Java 程序一般编译成类文件 （class file ) ，每 
个文件对应于程序或程序一部分的机器语言。与从 C 、 Pascal , 或 C ++ 编译而成的标准可执行 
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码不同，类文件无需对应于编写和运行程序的实际机器。类文件用机器语言编写，采用 Java 
虚拟机 (Java Virtual Machine , JVM ) 的指令集， JVM 只作为一个软件仿真，它是一个模仿芯 
片的计算机程序。这个“机器”有正常物理计算机（如 Intel 奔腾 4 )典型的、有时甚至更强大 
的结构和计算能力，但却没有物理芯片的很多问题和局限性。 

JVM 通常是一个运行于宿主机上的程序。像任何其他可执行程序一样，它采用本地机器 
的指令集运行于物理芯 片上。 这个程序有一个特殊的 用途： 其主要功能是解释和执行用 JVM 
机器语言写的类文件。通过运行一个特定的程序，安装在计算机中的物理芯片就可扮作 JVM 
芯片，因而就能运行用 JVM 指令集和机器码写成的程序。 

“虚拟机”的思想并非新生亊物。1964年， IBM 开始着手研发 VM / CMS , 这是一个面向 
System /360 的操作系统，能为许多用户同时提供分时服务。为了将计算机的服务全部地提供给 
每个用户， IBM 的工程师们决定建立一个软件系统和用户接口，给用户这样一个 感觉： 他或她 
自己在享有整个计算机的全部服务。每个人或程序都能按需支配整个虚拟 S /360 而不用担心该程 
序是否会导致另一个人的程序崩溃。这也使得工程师们能大幅度地更新或改进硬件而不用强迫 
用户* 新学习或策写程序。二十多年以后， VM/CMS 还在大型 IBM 主机上使用，运行为虚拟 
S /360 而设计和编写的程序，运行虚拟 S /360 的硬件已经快了几乎几百万倍。其后，虚拟机和仿 
真器已经成为很多编程工具和语言（包括 Smalhalk , —种早期的面向对象的语言）的标准件。 


补充资料 

• NET 框架 

另一个常用虚拟机的例子是 . NET 框架.由微软开发并在2002年发布。 . NET 框架是 
Visual Studio 当前版本的基础，并为很多基于网络的技术如 ASP . NET 、 ADO . NET、SOAP 
以及 .NET Enterprise Servers 提供了一个统一的编程模型。仿效 Sun 的 JVM 先例， . NET 引入 
了一个通用语言运行时 (Common Language Runtime , CLR ), 这是一个虚拟机，能管理 
和运行用若干种语官开发的代码。该虚拟机采用了虚拟指令集，称为微软中间语官 
(Microsoft Intermediate Language , MSIL ), 在思想上非常类似于 JVM 的字节码。甚至 CLR 
执行引擎的详细体系结构也类似于 JVM 。 例如，它们都是基于堆栈的体系结构，并为面向 
对象的、基于类的环境提供指令集支持。像 JVM —样， CLR 的设计具有虚拟机的大多数优 
势： 抽象可移植的代码可广泛地分布和运行而无需牺牲本地机器的安全性。微软还仿效 
Sun 开发和发行了一个巨大的预定义类库，为使用 . NET 框架并且不愿意从头开发类的程序 
员提供支持。两个系统的设计都考虑了 Web 服务和移动应用。与 JVM 不同的是， MSIL 或 
多或少是从头开发的.以支持多种編程语言，包括 J #、 C#、Managed C ++ 及 Visual Basic 。 
微软还建立了一个标准的汇编器 Uasn ^ 实际上， CLR 作为一个计算环境没有 JVM 那样通 
用和广泛发布，但是软件市场变化多端，最终结果尚无定论。 

一个可能会有重要影响的关鍵问题是徵软提供多平台支持的程度。在理论上 ， MSIL 
与 JVM —样是与平台独立的。但是. . NET 框架库的相当大的部分基于较早的微软技术， 
不能成功地运行于 Unix 操作系统上，甚至不能运行于较早的 Windows 系统上（如 
Wind OWS 98)。 微软支持非微软（或者更早微软）操作系统的历史记录未能鼓励第三方开 
发者来开发跨平台的 MSIL 软件。对比之下. Java 巳经建立了一个包括所有平台的强大的 
开发组, 依赖并支持这种可移植性。如杲徵软能继续履行其多平台支持的承诺 ，并开发 
出足够的客户基础， . NET 也许能取代 Java 作为开发和部署可移植的基于 Web 应用的首选 
系统。 
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1.3.2 可移植性问题 

虚拟机（特别是 JVM ) 的一个主要优势是，只要有适合的解释器，就可在任何地方运行。 
与 Mac 程序需要 PowerPC G 4 芯片才能运行（也有 G 4 仿真器，但很难找到而且很昂贲）不同， 
JVM 对于几乎所有计算机和很多种设备如 PDA 都可用。每个主要的 Web 浏览器如 Internet 
Explore 、 Netscape 或 Konqueror 都有一个 JVM (有时称为 “ Java 运行时系统 （Java runtime 
system )”， 建立该系统以使 Java 程序正确运行）。 

进一步地， JVM 能在任何地方连续运行，因为程序本身受基础硬件变化的影响相对较小。 
—个 Java 程序（或者 Java 类文件），除非考虑速度，它在一个为旧式奔腾计算机所写的 Java 仿 
真器上运行与在为顶端 Power G 7 (—款新的尚未出现的机型）所写的 Java 仿真器上运行会有 
相同的表现。如果/当 Motorola 开发出产品时，几乎一定会有人为它写一个 JVM 客户程序。 

1.3.3 超越限制 

虚拟机（特别是 JVM ) 能提供的另一个优势是超越、忽略或 屏蔽基 础硬件所施加限制的 
能力。 JVM 有虚拟部件，对应于上面讨论的真实计算机的部件，但因为它包含的只是软件， 
所以制造成本微乎 其微。 因此，这些部件的大小和数量均可按程序员的需要设置。芯片上每 
个实际的寄存器都要占据空间、消耗功率，并花费大量的金钱，因此，寄存器常常是相当短 
缺的。在 JVM 上，寄存器实际上是免费的，程序员可任意使用。连接 CPU 到存储器的系统总 
线的大小也可按程序员的需求设置。 

历史上的真实例子有助于说明这个道理。初始的 IBM - PC 是基于 Intel 8088芯片的。8088又 
基干 Intel 另外一款更早的芯片8086,两款芯片在设计上几乎相同，但8088采用的是8位总线而 
不是8086的16位总线。这无疑限制了8088的 CPU 和存储器之间的数据传输速度，相对于8086 
减小了大约50%,但 IBM 决定选择8088从而将制造成本和®价保持在低水平。不幸的是，这 
个决定在接下来的15年左右的时间限制了 PC 的性能，因为 IBM 、 Intel 和微软被要求在所谓的 
Intel 80 x 86 系列的毎个后代产品中都保持向后兼容。只有 Windows 的开发才使微软最终能充分 
利用较低的制造成本和更宽的总线。随着多数主要的软件和硬件制造商竞相在它们的产品中 
为若干种不同的芯片和芯片集提供支持，在商端芯片集中可利用的某些特性在低端却不能得 
到，类似的问题还在发生。适当编写的 Java 运行时系统能利用（专门为新的体系结构所写的 
JVM 上）可得到的特性，并使其为所有 Java 程序或 】 VM 类文件所用。 

与多数实际的计算机芯片相比， JVM 的优势还在于其设计在本质上更好、更整洁。部分 
原因是它是在1995年从头开始设计的，而不是通过继承若干代较早版本的工程折衷而得到的。 
设计者不必担心像芯片大小、功耗或成本这样的物理限制，由此而导致的简单性意味着设计 
者能够将其注意力关注于如何生成在数学上易处理和优雅的设计，并使高层次特性的加入成 
为可能。特別是 JVM 还考虑到更髙程度的安全增强技术，这一点我们将在下面简单说明，并 
在第10章详细讨论。 

1.3.4 易于升级 

与升级硬件的困难性相比，虚拟机的另一个优势是易于升级或改变。有大量证据证明， 
1994年发布的一款奔腾芯片有一个错误，即奔腾 P 54 C 的 FPU 不能正确工作。不幸的是，纠正 
这个缺陷要求消费者将旧芯片发回到 Intel 并进行完全的物理替换。与此形成对照的是 ， JVM 
实现上的故障可由程序员在软件中修复，甚至可以由能进行源码访问的第三方通过正常渠道 
分发，包括简单地在因特网上提供。 

类似地，一个新的改进 JVM 版本，或许算法得到更新或者速度得到大幅度提高，就可像 



第一部分假想计算机 


任何其他升级的程序（如视频卡驱动器或对标准程序进行安全升级）一样容易地发布。由于 
JVM 只是软件，多疑的用户甚至能保持连续若干个版本，在新版本有某些微妙和未发现的错 
误时，她还能返回到旧版本以使程序仍能运行。（当然，你只在发现该用户是正确的之前才认 
为她是多疑的，在这之后你会认识到她只是谨慎和负责任。） 

13.5 安全问题 

虚拟机的最后一个优点是，在基础硬件的协作下，可进 行配置 而运行在更安全的环境下。 
Java 语言和 JVM 的设计特别考虑了这种对安全性的增强。例如，多数的 Java 程序不需要访问宿 
主计算机的硬盘，若提供这种访问，尤其是写硬盘的能力，可能会使计算机面临计算机病毒 
的感染、数据失窃或者直接将极重要的文件删除或毁坏等危险。虚拟机由于只是软件，故能 
详査磁盘的访问企图，并实施比操作系统本身所能实施的更为楕密的安全策略。 

JVM 甚至走得更远，其设计不仅为了安全性也为了某种程度的可验证安全性。程序中的很 
多安全缺陷是意外产生的，比如，程序员试图读一个串却没有确保已分配足够的空间来保存它, 
其至试图执行一个非法的操作（或许是将一个数用 ASCII 串来除），结果就导致了不可预测和 
可能有害的结果。 JVM 的字节码被设计成可验证的，这种验证是通过采用计算机程序检验这种 
意外错误来实现的。这不仅降低了出现有害安全缺陷的可能性，也改进了软件的总体质设和可 
靠性。软件错误毕竞不一定会摧毁系统和允许非授权访问。很多错误会默默潜伏着（几乎是检 
测不到），然后产生错误的应答。在产生错误应答之前，有时甚至是在程序运行之前捕获这些 
错误将会大幅度地提髙程序的可靠性。 JVM 安全策略将在第10章进行广泛的讨论. 

1.3.6 劣势 、 

如果虚拟机是这么的神奇，为什么它们没有更普及呢？主要的原因，用一句话说，就是 
“速度”。进行一个特定的操作，通常用软件完成要比硬件完成少花费1000倍的时间，所以用 
Java 在 JVM 上做核心的计算（矩阵相乘、 DNA 测序等等）比用从 C ++ 编译得到的（面向特定 
芯片的）机器语言执行同样的计算要慢得多。 

幸运的是，实际的差距看起来没有近乎1000倍那么大，主要的原因是已有一些非常聪明 
的 JVM 实现者。一个写得好的 JVM 会尽可能利用可得到的硬件做尽可能多的操作。这样，程 
序就会（例如）利用本地机器的电路做加法，而不是全部用软件来 模拟。 编译技术的进步已 
使得 Java 运行速度几乎与本地编译的代码一样快，通常在2倍运行时间之内，有时几乎感觉不 
出 Java 较慢。在1998年2月的一项研究（“性能测试显示 Java 和 C ++ —样快”） 发现： 
对于一组测试基准任务，带有高效编译器的髙性能 JVM 所生成的程序一般在最差时也仅仅比 
对等的 C ++ 程序运行得稍慢（大约5.6%),而在多数情况下已到了度量的极限。当然，比较计 
算机和语言的速度是极为困难的过程，就像将标准的苹果和桔子做比较一样，不同的研究者 
会发现不同的价值。 

在某些方面，速度可能不成问题。对于非大嫒数值计算的大多数用途， Java 或任何其他 
合理的语言已经快得足够满足多数人的需要。 Java 及其扩展 JVM 提供了一组强大的基本计算 
程序，包括广泛的安全度量，这些都是在如 C ++ 等很多其他语言中没有的。没有理由认为， 
导致计算机快速崩渍与虽有点慢但能够运行完程序相比会是一个巨大的优势。 

一 个更重大的劣势是在程序员和实际物理硬件之间插入了 JVM 解释器。对很多要求汇编 
语言编程（游戏、髙速网络接口或配备的新外设）的应用，采用汇编语言的关键原因是能够 
在很低的层次上对硬件进行直接的控制（尤其对于外设），通常是按位和按线来控制的。一个 
写得不好的 JVM 阻碍了这种直接控制。随着对 JVM 的硅实现的开发，这越来越不成问题，比 
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如 aJile Systems 的 aJ -100 微控制器或 Zucotto Systems 的 Xpresso 系列的处理器。两个公司都在生 
产适合于手持的因特网设备的控制器芯片，并将基于芯片的 JVM 字节码的实现作为机器码。 
换句话说，这些芯片不要求任何软件支持来将 JVM 字节码转换为本地指令集，因此能以全硬 
件速度运行，并在位的层次上对硬件实施全面的控制。随着 java 芯片的开发， JVM 已经完成 
了一个全面的转变，这个转变是从允许对各种不同处理器进行可移植和安全访问的精巧的数 
学抽象开始，到其自身发展成为物理芯片。 

1.4 JVM 编程 


1.4.1 Java ： JVM 不是什么 

必须强调， Java 不等同于 Java 虚拟机，虽然它们是一起被设计出来的，并且常常一起使 
用。 Java 编程语言是一种高级编程语言，它设计成可支持在诸如因特网的分布式网络环境中 
的安全且平台无关的应用。也许 Java 最常见的使用方式是创建 “ applets ”， 作为网页的一部分 
下栽并与浏览器交互作用而无须占用服务器的网络连接。与此不同， Java 虚拟机是一个共享 
的虚拟计算机，它为 Java 应用的运行提供了*础。 

Java 设计的很多方面强烈地影响了 JVM 。 例如， JVM 是一个虚拟机恰是因为 Java 应该是一 
个平台无关的语言，所以它不能对观察者使用什么类型的计算机作出任何假设（见图1-13)。 
JVM 是围绕安全验证器的观念设计的，所以 Java 程序能运行在安全环境中。网络支持是在相 
对较低的层次上建立在 JVM 标准库中，以确保 Java 程序能够使用一个标准化的、有用的网络 
操作集。然而，两个产品之间没有必然的关联， Java 编译器在理论上能编译得到 PowerPC (较 
早的 Macintosh 计算机的基础硬件）的本地代码而不是编译为 JVM 字节码，而任何其他语言的 
编译器也可编译得到 JVM 代码。 


_\ \可执行码 




图 1-13 硬件兼容性和虚拟机 
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特别地，请见图 1-14 中的程序。这是一个简单的 Javag 序示例，其功能是输出一个给定的 
串到缺省的系统输出，通常是当前活动窗口。这个程序，或者类似的程序，常常是任何初级 
编程课程的第一个标准示例，虽然有时程序也可能是打开一个窗口并显示一个消息。然而， 
当更详细地考察时，却发现 Java 程序本身没做任何这类事情。为了得到执行，它必须首先通 
过某种转换程序（编译器）来生成一个可执行的类文件。只有这个类文件才能运行以产生期 
望的输出。 

Java 或任何编程语言，更适于被看作是用于指定计算机所执行计算的一种结构。用任何 
语言写的程序都是对一种特定计算的规范。为了使计算机完成工作，这种规范（程序）必须 
被转换成机器码，计算机最终将其辨析为一个程序步骤序列。 


public class 3avaExanp1e { 

public static void main(String [] args) { 

System.out.println("This is a sa«ple program."); 


Rjl -14 Java 程序样例 

1-4.2 样例程序的转换 

通常有很多方式来指定一个给定的计算 • 可用很多其他语言写出一个非常类似的程序。例 
如，图1-15、1-16、 1-17 显示了用 C 、 Pascal 及 C ++ 写出的具有相同行为的程序。这些程序在总 
体结构上也显示出极大的相似性。程序的核心是一行代码，以某种方式访问一个固定的串 
(由 ASCII 字符组成）并调用一个标准库函数将其传递到缺省的输出设备。其差別是微妙的并 
涉及细节。例如， Pascal 程序有一个名字 ( PascalExample ), 而 C 和 C ++ 版本没有。在 C 和 C ++ 
中，程序必须都显式地表示行末回车，而 Java 和 Pascal 有一个功能，可自动在行末加一个回车。 
然而，这些差异与显著的相似性相比就相当小了，尤其是考虑这与机器码之间的差异时。 

finclude <stdio.h> 

int main() 

{ 

(void) printfC'This Is a sample program.\n"); 


图 M 5 C 程序样例 


Program Pascal Example(output); 
begin 

writeln ('This is a sample program .’）； 

end. 


图 1-16 Pascal 程序样例 

using namespace std; 
finclude <iostream.h> 
int main() 

{ 

cout « "This is a sample program." « end!; 


图 M 7 C ++ 程序样例 
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根据前面对典型计算机的体系结构和组织的讨论，考虑以下 问题： 很少 CPU (如果有的 
话）在 ALU 或控制器内有足够的寄存器来存储整个串。（的确如此，因为在抽象中对串的长度 
没有一个必要的上界。否则的话，计算机就不会只输出一个句子，而是输出整个课本了。）没 
有 CPU 能用单个指令将串输出到屏幕。代之的是，编译器必须将程序分解成足够小的步骤， 
这些步骤都在计算机的指令集之内。 

0串本身必须存储在计算机存储器中的某个地方， 

2) CPU 必须确定存储位置 t 

3) CPU 还必须确定哪个外设输出消息， 

4) 必须确定消息的类型是什么， 

5) 必须将适当的指令传递到外设： 

6) 告诉外设串的存储位覽， 

7) 告诉外设该串是一个串（不是一个整数或是一个浮点数） • 

8) 告诉外设做适当的动作将串输出（可能还要自动加上一个回车）。 

一行代码可能要转换成8个或更多的计算机必须执行的单个操作。事实上，单行代码中所 
包含的要执行的操作数釐没有限制。像如下的 Java 代码 

1 = 1+2+3+4+5+6+7+8+9+10; 

对每个加法都需要一个操作，故在此情况下就有9个单独的计算。由于对数学公式的理论 
复杂度没有限制，因此对单个 Java 语句的复杂度也没有限制。 

1-4.3 高级语宫和低级语言 

将很多机器语言指令封装到单行代码是高级 ( high - level ) 语言的典型特征。 Java , Pascal 
等是这种语言的典型 例子。 Java 编译器的任务就是接受复杂的语句或表达式并生成适合的机 
器语言序列来执行这个任务. 

与此形成对照的是，低级 （ low - level ) 是以机器语言中的操作与程序代码中的语句之间 
有非常紧密的关系为特 征的。 采用这个定义，机器语言当然是一种非常低级的语言，因为一 
个机器语言程序与其自身之间总有一个1对1的 关系。 汇编语言 （assembly language ) 是一个 
对人而言稍微易读的语言，但仍是低层语言，其设计是为了提升对机器及机器代码指令的总 
体控制，但仍保证程序员可读并 理解。 汇编语言也以汇编语言指令与机器代码指令之间的1对 
1关系为特征。 

在机器语言中，指令的每个要素（也称为操作码 opcode , 是 operation code 的简写）像计 
算机中的其他任何内容一样是一个数。前一节提到操作码89 (0 x 59) 对 JVM 是有意义的，它 
将导致 JVM 复制一部分信息.在汇编语言中，对每个操作码都给出一个助记符 （ mnemonic ) 
(读做 “ mim - ON - ik ”， 来自希腊文字，是记忆的意思），它解释或槪述了该指令确切要做的工 
作。与操作码89对应的助记符是 dup , 是 “ duplicate ” 的简写。类似地，助记符 ladd 是 
“integer add ” 的简写，对应于执行整数加法的机器码。转换程序在这里称为汇编器 
( assembler ), 其任务是将每个助记符转换成适当的二进制操作码的形式，并收集计算机所需 
要的数据（见图1-18)。 
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图卜18编程过程 



1.4.4 JVM 所看到的样例程序 

上面样例程序的 JVM 机器码版本将会是很长且大部分不可读的二进制串。图 M 9 显示出 
与机器码对应的程序版本。该程序用低层次 JVM 汇编语言 jasmin 手工写成，伹也可根据原始 
的样例程序通过一个编译器生成。注意程序要长许多，几乎是30行而不是只有3行或4行，并 
且更难于理解。这是因为在写髙级语言程序时你认为理所当然的很多亊情在这里就必须精确 
和明白地予以指明。例如，在 Java 中，除非另外指定，毎个类隐含地都是一个 Object 类型的子 
类。而 JVM 则要求明确地定义每个类与其他类的 关系。 图 1-19 中的注释（以分号;开头）对于 
如何精确地定义和完成（隐含）操作给出了更为详细的、逐行的描述（面向人类阅读者）。 

要注意，虽然在 Java 中明确地支持和使用类、子类等槪念，但在本节中给出的 JVM 低级 
语言程序中并没有特別针对 Java 的内容。事实上，就像 Java 编译器的任务是将髙级 Java 代码转 
换成类似于 JVM 的机器码一样， C ++ 或 Pascal 编译器的任务是对特定平台的程序代码做同样的 
事情。没有理由认为 Pascal 编译器不能设计成生成 JVM 码而不是 PowerPC 或奔腾机器码作为最 
终（编译）输出。程序然后就运行于一个 JVM 上（例如，运行在一个 Web 浏览器中的 JVM 仿 
真器上，或者像较早提到的专用芯片上），而不是特定的芯片硬件上（见图1-20)。 



» 疋乂相天旳英又忤为 jasminExample.class 
• class public jasmiziExample 
• 定义 jasnlnExanple 为 Object 的子类 
.super java/lang/Object 

. 创逑对象所需的标准步* 

.method public <init>()V 
aload^O 



.end method . 

.method public static main([Ljava/lang/String;)V 
» 对于 System.out 和字符串，我们霱要两个堆栈元素 
.limit stack 2 

• 寻找 Systera.out (—个 PrlntStream 类型的对象） 

. 并将其放入堆栈 

getstatic java/lang/Systea/out Ljava/io/PrintStream ; 

I 4 找要打印的申（字符） 

. 并将其放人堆栈 

ldc "This is a sample prograa." 

» 调用 PrlntStream/prlntln 方法 

invokevirtual java/io/PrintStreaa/println(Ljava/lang/String;)V 

» ... 大功告成！ 



Rll-19 JVM 汇编语宫的样例程序 


Java 码 Jas*1n 码 JVM 机器码 


•r = 1+2 + 3 + 4 + 5; bipush 1 0x10 

0x01 

bipush 2 0x10 

0x02 

iadd 0x60 

bipush 3 0x10 

0x03 

iadd 0x60 

bipush 4 0x10 

0x04 

iadd 0x60 

bipush S 0x10 

0x05 

iadd 0x60 

istore_l 0x3c 


®l-20 Java, Jasmin 以及 JVM 机器码中的样例表达式（细节见下一章) 





28 _ 第一部分假想计算机 


1.5 本章回顾 

• 计算机只是高速执行算法的设备，其作为电子设备的构造细节并没有其作为信息处理设 
备的工作细节那样重要。 

•计算机的主要部件是中央处理单元 （CPU), CPU 又包含控制单元、算术和逻辑单元 
(ALU)、 以及浮点单元 （FPU)。 这就是所有计算实际发生的地方和程序实际运行的地方。 
• 存储器和外设通过一组总线连接到 CPU, 总线携带到达 CPU 和来自 CPU 的信息。 

•所有存储在传统计算机中的值都以二进制数字或位的方式存储。为方便起见，这些位组 
成较大的单位如字节和字。一个特定的位模式可能有若干种解释，如一个整数、一个浮 
点数、一个字符或一序列字符，甚至计算机本身的一组指令❶确定一个给定的位模式代 
表哪种类型的数据取决于上下文并在很大程度上是程序员的责任。 

•不同的 CPU 芯片有不同的指令集，代表 CPU 能做的不同事情和做亊情的方式。每个 C pu 
需要以不同机器语言写成的可执行程序，即使运行相同的程序。 

•虚拟机是一个程序，运行于真实 CPU 之上，并解释机器指令就好像它本身是一个 CPU 芯 
片。 Java 虚拟机 （JVM) 就是这种程序的一个常见例子，在几乎每台计算机和每个 Web 
浏览器上都可能找到。 

•虚拟机比传统基于硅的 CPU 有很多优势，如可移植性、很少的硬件限制、易于升级以及 
安全性。虚拟机可能在速度上有很大劣势。 

•Java 是能将很多机器码指令结合成单个语句的高级语言的例子。 C 、 Pascal 和 C ++ 是类似 
的髙级语言。这些语言必须进行编译，将其代码转换成机器可执行的格式。 

• 低级语言如汇编语言在程序语句与机器指令之间有一个紧密的、通常是】对〗的关系。 
•Java 与 JVM 之间没有必然的联系。多数 Java 编译器能编译到 JVM 可执行码，但是 C、 
C++ 编译器也能做到这一点。类似地，一个 Java 编译器能编译到奔腾4本地码，但是所产 
生的程序不能在 Macintosh 计算机上运行。 


1-6 习题 

I什么是算法？ 

2. 烹调书中给出的食谱是算法的例子吗？ 

3. 给出以下每句短语中所描述的计算机部件的 名字： 

•计算机的心脏和最终控制器，所有计算执行的地方 
• 负贵在机器内部移动数据的计算机部件 

•负责所有计算，如加法、减法、乘法及除法的计算机部件 
•一组线，用于对不同设备进行互连以实现数据连接 
•用于读、显示或存储数据的设备 
• 用于短期存储数据和执行程序的地方 

4 . 在一个16位的寄存器中能存储多少种不同的 模式？ 在这样一个寄存器中，能存储为（二进 
制补码）有符号整数的最大值是什么？最小值是什么？能存储为无符号整数的最大和最小 
值是什么？ 

5- 将下面16位二进制数转换成十六进制数和有符号十进制数（你不能使用计算器： ） ： 



• 0000000011111111 
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• 0100100010000100 
• 1111111100000000 
• 1100101011111110 

6. 将下面32位 IEEE 浮点数从十六进制转换成标准的十进制表示。 

• 0 x 40200000 

• 0 x 41020000 

• 0 xC 1060000 

• OxBD 800000 

• 0 x 3 EAAAAAB 

• 0 x 3 F 000000 

• 0 x 42 FA 8000 

• 0 x 42896666 

• 0 x 47 C 35000 

• 0 x 4 B 189680 

7. 将下面十进制数转换成 32 位 IEEE 浮点表示。 

• 2.0 

• 45.0 

• 61.01 

• -18.375 

• - 6.68 

• 65536 

• 0.000001 

• 10000000.0 

8. 能梢确地表示成32位整数但却不能表示成32位 IEEE 浮点数，存在任何这样的数吗？为什么？ 

9. 采用标准的 ASCII 表（査看因特网或附录 E ), 什么样的4个十六进制字节代表串 “ Fred ” ？ 

10•哪个 ASCII 字符串与十六进制数 0 x 45617379 相对应？ 

11. 对 或错： 二进制位数越多，值就越大。为什么？ 

12. 为什么为 Windows 奔腾 4 生成的可执行文件不能运行 于基于 PowerPC 的 Macintosh 上（在没 
有特殊的软件支持的情况下）？ 

13. 虚拟机相比基于芯片的体系结构的嵌重要的优点是什么？ 

14. 最*要的缺点是什么？ 

15. 什么语言可用于为 JVM 写程序？ 

16. 对应于下面语句有多少条低级机器指令？ 

x - a -¥( b * c )-¥( d * e )\ 


1.7 编程习题 

以下题用教师同意的任何语言写一个程序。 

1. 读入一个32位（二进制）有符号整数，并输出与其等值的十进制数。 

2. 读入一个32位（二进制）浮点数，并输出与其等值的十进制数。 

3. 读入一个十进制浮点数，并输出与其等值的 IEEE 64位卄六进制数。（注 意： 也许需要额外的读人） 

4. (以十六进制 IEEE 格式）读入两个32位浮点数 A 和 B ， 并以十六进制输出它们的乘积 A • B 。 
不要在内部转换成十进制浮点数再利用语言的乘法操作进行乘积计算。 

5. (以十六进制 IEEE 格式）读入两个32位浮点数 A 和 B ， 并以十六进制输出它们的和 A + B 。 
不要简单地转换成十进制再进行加法计算。 

6. (以十六进制）读入一个32位浮点数 A ， 并以十六进制和十进制输出其倒数 1.0/ A 。 你能使 
用该程序结合程序4完成浮点除法吗？怎么做？ 


2.1 符号表示 


第2章算术表达式 


2.1.1 指令集 

计算机的两个中心问题（也许确实是两个中心问题），是其缺乏想象以及能做的事情有限。 
考虑用一个典型的袖珍计算器计算下面的 问题、 图 2-1) : 

一个底面直径450米，髙150米的圆形山的体积是多少？用几分钟査 
一下几何课本你就会得到 公式： 圆锥的体积是底面面积和髙度的乘积的 
三分之一。底圆的面积是兀乘以半径的平方。半径是直径的一半。的值 
当然是 3.14 多一点。综合起来，答案 就是： 


-n 2 ' 


150 



你如何计算这个麻烦的公式？ 

这里就是计算机（在这个例子中就是计算器）的指令集扬眉吐气的地方。这个公式不能 
按原样输入到一个典型的计筧器。它需要被分解成计算器或计算机能处理的很小的片断。只 
有这种小片断的一个序列才能使我们得到 最后的答案。 这与传统的计算机编程没有差別，只 
不过这种计算器所采用的片断比 Java 等高级语言所用的要小得多。 

根据所使用的计算器不同，有若干种不同的按键序列可解决这个问题。在一个典型的髙 


端计算器上，下面的序列可计算 df : 


00回回0回00 

或者，也 可用： 

0S00 回 00 

整个计算可如下 进行： 

H □回日0[]00@@日刚13[]0回@ 


2.1.2 操作、操作数及顺序 

这里隐含了一些微妙的东西。首先注意这个计算器的“指令集”包括一个按钮，使得 
按一下按键就能得到一个数字的乎方值。它还有一个 n 按钮。没有这些便利，就需要更多的按 
键和更高的复杂性。事实上，几乎没有人知道什么样的按键序列能代替 [51 按钮。 

其次，这个序列中的顺序很重要。就像450与540之间存在差异一样，450 + 2与450 2+之 
间也存在差异。前一个得出的值是225,而后一个甚至没有意义（在传统的符号意义下） 。一 
般来说，人们想到的多数数学操作是二元的 （ binary )， 也就是说，这些数学操作接受两个数 
字（就是参数，正式的称谓是操作数 ( operand )) 并产生第三个数作为结果。3和4相加就得7。 
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—些髙级的数学操作，如 siiu :、 cosx 及 logx 是一元的 （ unary ), 意思是它们只接受一个参数。 
为了处理一个操作，计算机同时需要有定义执行哪种操作的操作符 （ operator ) 和所有必需的 
操作数的值，并且要以非常严格的格式给出。 

例如，按传统在黑板上书写数学公式时，二元操作写成中缀 （ infix ) 形式，意思是操作 
符写在两个操作数的中间（如3+ 4 )。三角函数如 sin 写成前缀 ( prefix ) 形式，即操作符在操 
作数之前（如 sin ^)。 一些高端计算器如惠普 HP 49 G 还支持后缀 ( postfix ) 形式（也称为逆 

波兰表示 (reverse Polish notation )), 即操作符放在操作数最后。在这样的计算器上，计算 
450除以2所需要的按钮序 列是： 

[4lf5l[0irENTCRir2l[g 

虽然这个表示乍看起来有些令人费解，但很多人在有了一点经验后更乐于使用它，其原 
因我们将在后面介绍。 

2.1.3 基于堆栈的计算器 

这种类型的计算器（采用逆波兰表示）采用称为堆栈 （ stack ) 的数据结构很易于建模。 
这个术语来源于自助餐厅中叠在一起的盘子或快餐馆中的泡沫塑料杯（见图 2-2) 所呈现的谀 
象。这样的杯子通常摞在弹簧支撑的容器中，杯子的重董将整个一堆杯子压下使得顶上的杯 
子总是保持在一个不变的髙度。在任何时候，只有顶上的杯子被移走（导致堆的其余部分向 
上略微弹出并露出一个新的 杯子） 或者可在顶上再放进一个杯子将杯子略微向下压。用稍微 
抽象的术语说，只有顶上的对象是可访问的。 

n 

只有堆栈顶上的杯子是可访问的 


当顶 t 的杯子被移走时， 

为了保持 m 上的钚子可访问 
弹簧支撑的托盘将杯子向上托 

图 2-2 自助*厅的一堆杯子 

堆栈是一组具有类似访问性质的数字或数据对象。只有“顶部”的对象是可处理的，它 
可以在任何时候被移走（“弹出”），另外的一个对象可以加入 （“压 入”）堆栈而取代原来的顶 
部对象成为新的顶部对象（原来的顶部对象就处干距顶部的第二个位置，依次类推）。基于堆 
栈的计算尤其适用于后缀表达式。各个项依次压入堆栈。对于像 sin 和 cos 这样的一元操作，可 
简单地弹出堆栈顶部的项作为操作数，然后执行这个操作，再将结果压入。对于像加法这样 
的二元操作，就弹出堆栈顶部的两项，然后执行操作，再将结果压回堆栈。 
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下面的操作序列执行了上面所描述的 计算： 

1 3 + • 450 2 +4502 + • 150. 

打开这个序列，前面的数字1和3被压入堆栈。然后，这两个数被弹出并计算出其商为1/3 
即0.3333。压入值，然后 0.3333 和 ji 相乘，得依次类推。计算可按序列快速执行，无 
需使用括号和结构。特别要注意，操作的顺序不会有二义性，而这种情况却可能在中缀表达 
式中出现，比如1+3.4。两种可能的等价表达式是1 3 4 •+ 和1 3 + 4 •显而易见是不同的。 

2.2 存储程序计算机 

2.2.1 取指—执行周期 

计算机在进行计算时，当然不需要人通过操作设备（通过按钮）直接与其打交道，而是 
将每个可能的操作存储成位模式（如前面章节所述）。操作的序列就存储成包含位模式序列的 
程序。计算机通过读存储器（到控制单元）而获得指令，并将每个位模式解释成要执行的操 
作。这通常称为取指•执行周期 （ fetch-execute cycle ), 因为这种执行是周期性的和无限的， 
在计算机中每秒要运行几百万或几十亿次（见图2-3)。 




- 


IR | | 


班-条指令 I 

0 x3000 



第二条搰 

0x3001 

PC | 0x3000 卜 


*三条柑令 

0x3002 



第四 i 柑令 

0x3003 






IR I msmictioo 



PC I 0x3001 


« | 


2nd ifwtmctioa 1 

pc | 

0x3002 |- 



0x3000 

0x3001 

期:二 無指令 

第二条 ft 令 

0x3002 

第四条指令 

0U003 



第一条指令 

0x3000 

第二条衔令 

0x3001 

00002 

第三 条指今 

第四条指令 

0x3003 




0x3001 


图 2-3 取指-执行周期 
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控制单元内部至少有两个重要的存储位置。第一个是指令寄存器 (instruction register ) 
即 IR ， 它保存了刚从存储器中取来的位模式，因而该位模式可以得到解释。第二个是程序计 
数器 (program counter ) 即 PC ， 它保存了要取出下一条指令的地址。在正常情况下，每次取 
出一条指令， PC 递增并指向存储器中下一个字。例如，如果 PC 包含模式 0 x 3000, 则下一条指 
令就将从这个地址取出（解释成一个存储器地 址）。 这意味着存储在地址 0 x 3000 处的位模式 
(不是 0 x 3000 本身）将被放到 1 R 。 PC 然后得到更新，存储的新值是0 x 3001。在以后的连续周 
期中， PC 将包含0 x 3002、0 x 3003、 0 x 3004 等等。在每个这样的周期中， IR 包含计算机要执行 
的指令。指令的典型例子包括数据传綸（数据在 CPU 和存储器或 I / O 外设间移 动）、 数据处理 
(对已经在 CPU 中的数据做一些算术和逻辑操作），或者影响到控制单元本身的控制操作。 

对指令加以解释本身是一个中等复杂度的任务，部分原因是某些指令实际上是需要进一 
步详细说明的指令组。例如，将信息存到存储器的指令是不完备的。什么信息要存储？要存 
储到存储器中的哪个位置？此外，很多机器需要更多的细节，如“寻址模式”（这个位模式指 
的是一个存储器位置还是指一个数呢？）、要存储的数据的大小（字数）等等。基于这个原因， 
很多机器语言指令实陈上是相关位的综合体（就像前面一章中浮点数的详细结构一样）。 

针对 IBM-PC (Intel 8086及更晚的机器）的一个例子是简单的 ADD 指令。这个指令可编码为两 
个字节，其中第一个8位保存的数是0 x 04,第二个8位保存一个无符号的从0到255的8位数。这个数 
隐含地将被加到已经存储在特定位 K (即 AL 寄存器， CPU 中一个特殊的8位寄存器）的数上。如 
果你需要加一个大于255的数，就要用一个不同的机器指令，这个指令的第一个字节是 0 x 05, 接下 
来的1啦定义了一个从0到65 525之间的数。如果你想将数加到一个不在 AL 寄存器的数中，则机器 
指令就以操作代码字节 0 x 81 开头，第二个字节定义数存储的地址，然后定义将要被加的数。 

由于 JVM 体系结构所选择的设计（特别是，所有加法都在-个地方（即堆栈中）完成)，使得 
在 JVM 上的相应解释任务较为容易（见图 2>4 h 下一节中将会讨论到，这既反映了设计者的基本 
设计理念也反映了 JVM 本身的能力。例如，所有的加法都在堆栈上完成（就像在 RPN 计算器中一 
样)。这意味若计算机不需要担心加数来自哪里（因为它们总是来自堆栈）或者相加所得的和送到 
哪里（因为它总是送回到堆栈)。这样，两个数相加的指令就是一个单字节的值 0 x 60, 不会混淆。 



W 2-4 在 JVM 上基于堆栈的计算示意图 
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补充资料 

存储程序计算机和冯 • 诺依曼体系结构 

第一台计算机产生于第二次世界大战中的弹道计算器和密码破译机。将它们称为计算 
机几乎是不对的，因为它们实际上仅仅是复杂的专用电气设备。最重要的是，要改变它们 
的用途，就需要改变机器的物理电路。程序是“硬连线”到计算机中的。如果需要求解一 
个不同的问题，你就要重连机器并建立新的电路。 

伟大的数学家约翰•冯 • 诺依曼认识到了这个重大的局限性并为建造“通用”计算机 
提出了（在1料6年与 Arthur Burks 和 Hermann Goldstine 合写了 “电子计算设备逻辑设计的 
初步讨论”）一个革命性的概念。他确定了计算中涉及的 4 个主要的“器官”，分别与运算、 
存储、控制以及与外部世界（和人类操作者）连接有关。根据他的观点，建立通用计算机 
的关 鍵是： 计算机应该不仅能存储算术运算的中间结果，还能存储产生这些计算的（指令） 
顺序。换句话说，“控制器官”应该能从存储器中读入模式并依次行动。而且，控制模式 
的存储应该与数字数据的存储一样灵活。 因此. 为什么不像存储数字数据一样将指令也存 
储成二逬制模式呢？这样，控制器官的设计就变成一种选 择器： 当该模式被从存储器中读 
出时，就激发相应的电路。冯•诺依曼进一步指出，如果存在某种方式能加以分辨，控制 
模式和数据模式甚至能处于同一存储 器中。 与此不同的另一种方式（现代计算机所采取的 
途径） 则是， 两者的区分不是通过模式，而是通过用途。任何装入到控制单元中的模式就 
自动被认为是指令。（一个与其竞争的体系结构称为哈佛体系结构 (Harvard architecture ), 
它采用分开的存储器分别存储代码和 数据。 我们将会在后面讨论 Atmel 微控制器时看到这 
种体系结构）。这也意味着指令可作为数据使用，甚至能被* 盖， 使得自修改代码 （ self ¬ 
modifying code ) 成为可能。这使得计算机可自行重编程，比如，通过将程序（作为数据） 
从外存储器拷贝到主存储器，然后（作为代码）执行程序。 

冯 • 诺依曼计算机的操作是通过重复地执行以下操作完 成的： 

1) 从存储器官中取得一个指令模式。 

2) 确定并从存储器中取得该指令所需的数据， 

3> 在运算器官中对数据进行处理 # 

4) 将运算的结果存储到存储器官中。 

5) 返回到步*1。 

冯•诺依曼就这样奠定了当今计算机大部分的理论基础。例如，他提出的四个器官可 
以容易地与 ALU 、 系统存储器、控制单元以及较早定义的外设对应起来。他提出的操作方 
法就是取指一执行循环。研究者们这几十年一直在探究冯•诺依曼体系结构，并且已能在 
某些方面突破他的模型的限制。例如，一般来说，多处理器系统用几个 CPU 代替单控制器 
官，每个 CPU 可独立操作。一个更激进的非冯•诺依曼体系结构可在各种神经网络和连接 
系统设计中看到，在这种系统中，“存储器”分布在几十到几千个互锁的“单元”中.并 
且没有控制器官。今天，“冯•诺依曼计算机”这个术语已经很少提及了，就像鱼不会常 
常谈论水一样。这种计算机无所不在，所以通常假定任何给定的机器都遵循冯•诺依曼/ 
存储程序体系结构。 


2.2.2 CISC 计算机与 RISC 计算机 

显然， CPU 要做的不同事情越多，操作代码和机器指令就越多。不同的操作代码越多, 
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需要的位模式就越多，就需要（平均）更长的位模式以确保计算机能将它们分辨开来。（想象 
一下，如果 0 x 05 不仅是“将两个数相加”的意思，还是“停机”的意思，会发生什么样的灾 
难！计算机怎么能区分出它究竟是什么意思呢？）然而，更长的操作代码就意味着有更大的 
IR ， 就意味着有更大的总线将计算机连接到程序存储器，也就意味着有更复杂和昂贵的电路 
来解释指令。因为毎个操作可能需要不同的连线和晶体管，这样，一个复杂的指令集就需要 
有很多的电路来执行各种操作。这意味着这种复杂的 CPU 芯片会很昂贵，需要高成本的支持， 
并且与更简化的设计相比每条指令的运行更慢。（而且还需要更大的芯片，运行时更热[因此 
需要有更好的冷却系统],消耗更大的功率，降低了电池的寿命。） 

这就意味若更小的指令集就更好吗？不一定，因为虽然具有精简指令集的 CPU 可能对某 
些任务运行得更快（例如，每个 CPU 都需要完成两个数相加的能力），但还有很多任务，较小 
的 CPU 需要几个步骤才能 完成。 例如，一个复杂指令集计算 （complex instruction set 
computing , CISC ) 芯片可能会将一块数据，比如包含有几千字节的串，从存储器中的一个位 
罨移 动到另一个位 置而无 需使用 CPU 内部的任何存储器。与此相比，一个精简指令集计算 
(reduced instruction set computing , RISC ) 芯片可能躭不得不将每个字节或者字先从存储器移 
动到 CPU , 然后再移动到存储器。更*要的是，在毎个步骤，移动字节的指令都要被取出和 
解释。所以，虽然总体上取指-执行周期可以运行得更快（通常也确实是这样），但特定的程 
序或应用却需要用很多指令（很慢地）完成任务，而 CISC 计算机却可以用单条（虽然长且紅 
杂）的指令完成同样的任务。 RISC 支持者所声称的另一个优势是对“滋长特性主义” 
(creeping featurism ) (即设备和程序为了有新特性而增加复杂度）的抵御。一个 RISC 芯片通 
常有一个小的、纯净的并且定义简单的设计，并且在未来的版本中将保持这种小而纯净且简 
单的特点。而 CISC 的较新版本通常会加入更多的指令、更多的特性以及更髙的复杂性。这会 
带来很多影响，其中之一就是阻碍了向后兼容性，因为给较晚 CISC 写的程序通常会使用那些 
六个月之前的 CISC 中不存在的特性和指令。当然，在另一方面，新加入的特性也许对工程师 
们是有用的。 

当前布场上的两歎主要的 CPU 芯片为这种差异提供了很好的例证。奔腾4是 CISC 芯片，具 
有巨大的指令集（其至不考虑使用哪个寄存器或存储器位 K 保存数据，单是 ADD 就已有34种 
不同的表示方式），而 PowerPC 是一个 RISC 芯片，其设计是为了能快速执行常见的操作，对罕 
见或 复杂任 务則用时要长得多。因为这个原因，在比较两个 CPU 间的处理速度时，我们不能仅 
仅去看时钟速度这样的数字。在 R [ SC 芯片上的单个时钟周期一般对应于单个机器指令，而在 
CISC 上做任何事一般都要至少两个或三个时钟周期。另一方面，根据应用的不同， CISC 中较 
大的指令能在较少的时钟周期内做更复杂的计算。这样，性能的差异就更取决于正在运行的程 
序类型和具体的操作而不是时钟速度的差异。特别地，苹果公司的销售文件声称，仅仅通过在 
每个时钟周期做更多亊情， （ RISC ) 865 MHz 的 Power Mac G 4 就比 （ CISC ) 1.7 GHz 的奔腾4运 
行起来平均要快大约60% (图形和音频操作要快3到4倍...）。不管你是否相信苹果公司的销售 
文件，他们的中心点（即时钟速度并不适合比较不同的 CPU , 另外计算机的指令集可按不同种 
类的任务进行设计）仍几乎是不可辩驳的，而无论在这场 CISC / RISC 争论中你站在哪一边。 

2.3 JVM 上的算术运算 
2.3.1 —般评述 

Java 虚拟机是基于堆栈的 RISC 处理器的一个示例，但要注意其在物理上是不存在的。像 
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多数计算机一样，因为效率的原因， JVM 的直接算术运算能力限于常见和简单的操作。很少 
有计算机提供三角函数， JVM 也是这样，但所有计算机都支持基本的算术运算，如加法、减 
法、乘法及除法。然而，通过采用基于堆栈的计算（就像较早讨论过的髙端计算器）， JVM 超 
出了多数的计算机。这使得在其他计算机上进行仿真非常容易，而固定数量的寄存器是不能 
实现这种仿真的。 JVM 本身维护着一个保存二进制模式的堆栈，维护着先前压入的元素和早 
先计算的结果。任何操作的操作数都取自于堆栈顶部的元素，计算结果也返回到堆栈的顶部。 
要计算 7. (2 + 3), 则将7、2、3 (按顺序）压入堆栈，然后，先执行加法再执行乘法。 

因为 JVM (以及一般意义上的 Java ) 采用有类型 （ typed ) 的计算，所以这个过程实现得 
更复杂一些（在这一点上，它与多数的 RISC 机有点不同，但它提供的安全性高得多 >。就像 
在前一章所讨论过的，相同的位模式可表示若干个不同的项，而相同的数可用若干种不同的 
位模式表示。为了准确地处理这些问题，任何计算机都需要知道由位模式表示的数据类型。 
JVM 仅仅是在如何严格地保证这种类型系统以防止程序错误方面显得不同一般。 

因此，根据加法操作数的类型的不同，就有若干种不同的方式来表示加法。（这也许就将 
JVM 置于 CISC / RSIC 争论的中间某个地方）。一般来说，操作名的首字母就反映了所期望的参 
数类型和结果类型。要将两个整数相加，就使用助记符 ladd ， 而要将两个浮点数相加，就使 
用助记符 fadd 。 其他算术操作也遵循这个模式，所以整数相减的操作就是1 sub ， 而两个双精 
度数相除的操作就是 dd 1 v a 

详细地看， JVM 堆栈是一组32位数的集合，没有固定的最大深度 # 对于可以放入32位寄 
存器的类型，将数据元素存到一个堆栈位罝没有问题。更长的类型通常存储为成对的32位数， 
所以一个64位的“双梢度”数在堆栈顶部实际上占用两个位置。 

JVM 堆栈上有多少个 位置？ 理论上，因为 JVM 没有硬件限制，你需要多少就有多少。实 
际上，你写的每个程序、方法或函数都会定义一个最大堆栈大小。类似地，对所需的存储器 
大小没有硬件定义的限制。与此不同，每个方法都定义了局部变 ft 的最大数量，这些变量不 
是存储在堆栈上，而是用于临时存储值。 

2.3.2 —个算术指令集示例 

数据类型 * 

JVM 支持8种基本数据类型，其中多数与 JAVA 语言本身的基本数据类型密切对应。这些 
类型列在表 2-1 中。 JVM 还提供了大多数的标准算术操作，包括学生们可能不熟悉的一些操作。 
为了精简指令集，做了某些设计简化。 


表 2-1 JVM 的基本类型及其表示 


类型 代码 




32位带符号螫数 
32位 IEEE 754浮点数 
64位整数，存储在两个连续的堆栈位置 
64位 IEEE 754浮点数（如上） 

8位带符号整数 
16位带符号整数 
16位无符号整数或 UTF -16 字符 
Java 对象 


值得注意的是这一组类型中没有布尔 ( boolean ) 类型，布尔类型在 Java 中但不在 JVM 中。 
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布尔变量当然只能存有真或假值，并可用单个位来实现。然而，在大多数计算机中，访问单 
个位要比访问一个字低效得多。为此，在 JVM 中，布尔值简单地表示成字大小 <32位）的0或 
1，也就是整数。 

小于字的存储类型，如字节、短整数及字符，相当于次级类型。由于在 JVM 中做32位数 
学计算不会比做更小数的数学计算用的时间更长，故所有这种数据类型的变量就自动在 CPU 
内提升为32位整数。另一方面，这种类型的变量在存储时有一个明显的不同。例如，一个1百 
万字节的数组所占用的空间是类似整数数组的四分之一。由于这个原因， JVM 支持小类型 
(字节、短整数、字符甚至布尔）从存储器中读出或存到存储器，特别是对于数组的存取。 

基本算术操作 

对于这些需要通过特殊的处理来支持的数据类型，几乎每个类型和操作的组合都需要一个特 
定的操作代码和助记符。为简化程序员的任务，多数的助记符都使用字母码来指明动作的类型。例 
如，将两个整数相加的助记符是1 add ， 将两个长整数相加就要用1 add , 而要将两个浮点数和双精度 
数相力 n 就分別用 fadd 和 dadd 。 为简便，这个系列简写成? add , 其中?代表任何合法的类型字母。 

基本的算术操作加 （？ add )、 减 （？ sub )、 乘 （？ mul )、 除 （？ d 1 v ), 对4种主要的类型 
(整数、长整数、浮点数及双精度数）都进行了定义。所有这些操作都是通过从堆栈位置弹出 
前两个“元素”（注意，对于长整数或双精度数的操作，前两个“元素”的每个元素都涉及两 
个堆栈位 Si , 因此总共就要四个堆栈位 置）， 计算结果，然后将结果压回到堆栈顶部。此外， 
JVM 提供? neg 操作，其功能是对堆栈顶部项的符号取反。这当然也可以通过将值 -1 压入堆栈 
然后执行一个乘法指令来实现，但对干这个常见的动作，用一个专用的操作会执行得更快。 

? d 1 v 操作有一个方面需要引起特殊注意。 Idlv 和 ldiv 都痛要对整数操作并产生整数作为 
结果（没有分数或小数） * 例如，8除以5产生结果1,而不是浮点数1.6。要执行一个浮点除法， 
就有必要先将两个参数转换成浮点或双楕度类型，这在后面将要讨论。类似地，对整数和长 
整数类型有一个特殊的操作? rem , 其功能是取余数或樓 （ modulus )。 这个操作对于浮点/ 双精 
度类型不存在，因为除法操作要执行的是精确的除，就是说要精确到机器表示所允许的程度。 

逆辑操作 

JVM 只为整数和长整数类型提供了基本的逻辑操 作：与 （？ and )、 或 （？ or ) 及异或 
(? xor ) (见图 2-5 和图2-6)。这些操作以按位 （ bitwise ) 的形式进行，意思是第一个操作数的 
每个位都独立地与第二个操作数的相应位进行操作，结果就是各个独立位操作结果的总和。 
当应用到布尔值时，0与/或1,结果正如所料。0的表示是 0 x 0000, 1的表示是0 x 0001。对于除 
了最后一位的位置，相应的位是0和0,对于锒后一个位置，相应的位就是0和1。值 0 x 0000 与 
0 x 0001 进行 OR 操作就等于0 x 0001。换句话说，假 OR 其 是真，正如预期。 


第一个值 
第二个值 

1 1 0 0 1 0 1 0| 

1 1 1 1 0 0 0 0| 

= 0 xCA 
= 0 xF 0 

AND 结果 

1 1 0 0 0 0 0 0 

= 0 xC 0 


图 2-5 按位 AND 操作示意图 


第一个值 
第二个值 

1 

1 

1 

1 

0 

1 

0 

1 

1 

0 

0 

0 

1 

0 

0 

0 

= 0 xCA 
= QxF 0 

XOR 结果 

0 

0 

1 

1 

1 

0 

1 

0 

= 0 x 3 F 


图 2-6 按位 XOR 操作示意图 
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移位操作 

除了这些熟悉的操作外， JVM 还为改变位模式尤其是在数中移动位而提供了一些标准的 
移位 ( shift ) 操作。在 Java / C / C + + 中，这些都表示成<<或者>>操作符。基本的操作就是将数 
中的每一位向右或向左移动一个位置。以二进制模式 OxBEEF 为例： 


B 

E 

E 

F 


1011 

1110 

1110 

1111 

becomes 

0111 

1101 

1101 

1110 

左移一位 

0101 

1111 

0111 

0111 

右移一位 


这样， OxBEEF 左移一位就成为 0 X 7 AAE , 右移一位就成为 0 x 5 F 77。 在两种情况下，右边 
或左边留下的空位都用0来填充。这种移位称为逻辑移位 （logical shift ), 与算术移位 
(arithmetic shift ) 相 对应。 算术移位试图保留数的符号，所以在算术右移时，要不断地复制 
符号位填充在空位上。（算术左移无需复制最右边的位)。 


B 

E 

E 

F 


1011 

1110 

1110 

1111 

becomes 

0101 

1111 

0111 

0111 

$辑右移 

1101 

1111 

0111 

0111 

算术右移 


特别对于有符号数的佾况，逻辑右移的结果总是正数，因为0被插入到了烺左边的符号位。 
相比之下，当且仅当原始值是负数时，算术右移的结果总是负数，因为在操作时符号位被复 
制。对于无符号数，左移等价于将该数乘以2的某次幕，而逻辑右移等价于将该数除以2的某 
次幂。一般来说，这些操作用于将一组已知的位放置于模式中的特 定位罝 上，例如用来作为 
将要进行的按位 AND 、 OR 、 XOR 操作的一个操作数。 JVM 为执行这些移位提供三种操 
作 ： ?shl (左 移 ）、 ?shr (算术右 移）、 及 ？ ushr (逻辑右移，这个助记符实际上表示“无符 
号右移”），这些操作对整数 （32 位 模式） 和长整数 （64 位模式）都适用。 

转換操作 

除了这些基本的算术和逻辑操作，还有一些形式如?2?的一元转换操作。例如， 12 f 就是 
将一个整数（1> 转换成一个浮点数 ( f ). 一般来说，每个这种操作都是弹出堆栈顶端的元素， 
将其转换成合适的新类型，并将结果压入堆栈。这通常不会改变堆栈的总体大小，除非转换 
是从长类型到短类型（或相反）。例如，操作将从堆栈弹出一个字 （32 位），将其转换成64 
位 U 个字），然后将两个字的数压入堆栈，占两个元素。所产生的效果就是使堆栈的深度增 
加 h 类似地， d 21 操作会将堆栈深度减小1。 

如前所述，因为效串的原因，不是所有的类型组合都为 JVM 所支持。一般来说，转换到 
整数或从整数转换到其他类型的数总是可以的。在四种基本类型整数、长整数、浮点数、双 
精度数之间进行转换也总是可以的。然而，从一个字符就不能通过一次操作直接转换到一个 
浮点数，反过来也不行。这有两个主要原因。首先，由于小于字 （ sub - word ) 的类型自动地 
转换成字类型，所以这个本来要定义成 D 21 的操作在某种意义上说是自动进行，甚至是不可避 
免的。其次，如前所述，将整数转换成浮点数（例如， 2-2.0) 不仅涉及从更大的整体中选 
择特定的位，还采用了完全不同的表示系统，并改变了表示的基本模式。如果需要在一个浮 
点数和一个字符之间进行转换，就可通过两个步骤来完成 ( f 21, 12c )。 由于类似的原因，三 
种操作 i 2 s 、 i 2 c 、12 b 的输出有些不寻常。操作结果不是生成（并压入）助记符中的第二个类 
型的数，而是生成一个整数。然而，生成的整数将被截断成适当的大小和范围。这样，在 
0 x 24581357 上执行 12 b 操作就会产生模式0 x 00000057,等价于单字节0 x 57。 
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2.3.3 堆栈操作 


无类型堆栈操作 

除了这些特定类型的操作， JVM 还为日常堆栈处理提供了一些通用和无类型的操作。一 
个简单和明显的例子就是 pop 操作，其功能是从堆栈弹出单个字。由于这个值就要被丢弃，所 
以它是一个整数、一个浮点数、一个字节或者其他类型都不要紧。类似地， pop 2 要从堆栈移 
除两个字，或者就是一个双字的条目、或者是一个长整数 • 或者是一个双精度数。这种类型 
的类似操作还包括 dup ， 其功能是在堆栈顶端复制并压入单个字的条目。 dup 2 则是复制和压入 
一个双字的条目。 swap 的功能是交换堆栈顶端的两个字。 nop 是“无操作”的缩写，它不做任 
何亊情（但要占用时间，所以在需要使机器等待一微秒左右时间时可用这条指令）。 

此外，还有一些不常用的操作，用来执行相当特殊的堆栈操作。比如 dup _ xl ， 其功能是复 
制堆栈顶端的字然后将其插入到第二个字的下面。如果堆栈自顶向下保存的值是 （5 346), 则 
执行 dup _ xl 就会产生（5 3546)。这些特殊的操作见附录 B , 在本书中就不做进一步讨论了。 

常数和堆栈 

当然，为进行这些基于堆栈的计算，就需要用一些方法首先将数据 S 于（压入）到堆栈 
上。根据要压入的数据类型以及该数据来自于哪里， JVM 有若干个这种方法。 

最简单的情况是将一个常数压入到堆栈。根据该常数的大小不同，你可以使用 blpiish 指 
令（压入一个字节的带符号整数）、 slpush 指令 （2 字节带符号整数）、 ldc 指令（一个单字的 
常数，如一个整数、一个浮点数或一个地址）、或者〗 dc 2 - W 指令（一个双字的常数，如一个长 
整数或一个双楕度数）。所以，将整数3和5压入到堆栈，然后将它们相乘的代码就如下 所示： 


bipush 5 
bipush B 
Imul 

其变型： 

si push 5 
sipush 3 
imul 


ldc 5 
ldc 3 
imul 


能完成 M 样的事情，但效串比较低。因为5和3很小，可以装入到单个字节中并用 bipush 
指令压入。而且还要注意，因为乘法是可交换因数位置的，所以你先压入5还是先压入3没有 
关系。减法和除法就不是这种情况，在这两种操作中，计算机从先压入的数中减去后压入的 
数，或者将先压入的数除以后压入的数。所以，在上面例子中，用 Idlv 取代 imul 将导致5除以 
3,在堆栈上产生结果1 (不是1.66667,因为 idiv 规定的是整数除，小数部分被舍掉）。 


为了提高效率，有若千种专用操作能将常用的常数以更快的速度压入到堆栈。例如， 
1 const _ N , 其中 N 是1、2、3、4、5之一，就能将一个字的整数压入到堆栈上。由于合常有必 
要将一个变貴初始化成 1 或者将一个变最加 1 , 1 const _ l 要比实现同样功能的 bipush 1要快。 
这样，我们就可将上面例子重写成如下代码使其运行得稍微地快一些： 



imul 


类似地， iconst _ ml 将整数值 -1 压入。等价的快捷表示还有针对浮点数的 （ fconst _ f^f 
于0、1、2)、长整数的 （ lconst — N 对于 0 、 1 )、以及双精度数的 （ dconst _ N 对子0、1)。 


局 部变量 

除了装入常数，还可以从存储器装入值。每个 JVM 方法都有一组可自由随机并以任何顺序 
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访问的存储器位置与其关联。像堆栈一样，可得到的存储器位置不受硬件的限制，可由程序员 
设定。而且，如前所述，装入的模式类型决定了操作及助记符。要装入一个整数，就用1 load , 
要装入一个浮点数，就用 fload 。 各操作都能够取得适合的变量并将其值压入到堆栈顶部。 

变量利用顺序的数字来引用，从0开始。所以，如果一个给定的方法有25个变量，就有0 
到24的数字。每个变 ft 存储了一个标准的字大小的模式，所以变量没有类型。双字模式（长 
字或双精度字）的存储就稍微更复杂一些，因为每个模式必须占用两个相邻的变量。例如， 
从变釐4装入一个双精度数，实际上是从两个变* 4 和5读取值。此外， JVM 还允许若干种 
像？ load _ N 这样的快捷方式，所以用 1 load 0或者快捷方式? load_0 都能从局部变董 0 (#0) 装 
入一个整数值。对于所有4种基本类型、从0到3的所有变董都存在这个快捷方式。 

类似地，数据可从堆栈弹出，并存储在局部变量中以备后用。这种情况采用的指令 
是？ store , 其中首字符仍是存储类型。如前所述，存储一个长整数或双精度数实际上要执行 
两次弹出操作，并将结果存储在两个相邻的变董中。所以，指令 dstore 3要从堆栈中移出两 
个元素而不是一个，并改变两个局 部变量 #3和# 4 。同样，如前所述，对所有类型并且 N 从0到 
3变化时都存在形如? store _ N 的快捷方式。 

2.3.4 汇编语言和机器码 

让我们看一个简单的代码片断来了解各种转换如何发生。我们将从单条简承的高级语言 
语句幵始（如果“简单高级语言语句”在术语上没有矛 盾）： 

x-l+2+3+4+5; 

这条语句（很淸楚吧？）要计算常数1到5的和并存入局部变量 X 。 首先的问越是 JVM 不理 
解命名局部变攮的思想，只理解编号的变敢。编译器需要识別出 x 是一个 变釐， 并为其分配相 
应的编号（假设使用#1并且它是一个整数）。执行这个任务所需要编写的一种代码（还有很多 
其他写法）就是如图 2-7 所示的操作序列。 



图 2-7 Jsmln 程序片断 #1 


这是编译器的主要任务，就是将髙级语句转换为若干个基本操作。到此，汇编器（或者 
编译器的一个不同 部分） 的任务就是将每个操作助记符转换为相应的机器码字节。全部的对 
应关系在附录 B 和 C 中给出。我们注意到该程序用到的 iadd 对应于机器指令0 x 60。转换全部程 
序就产生表 2-2 所列出的结果。 

这样，相应的机器码就是字节序列0 x 04、0 x 05、0 x 60、0 x 06、0 x 60、0 x 07、0 x 60、0 x 08、 
0 x 60、 0 x 3 c , 这些将被存储到磁盘上作为可执行程序的一部分。 

转换并不总是这么简单，因为一些操作要占用多个字节。例如， bipush 指令将一个字节 
压入到堆栈上（就像 1 const _0 将0压入到堆栈上一样）。但是，是哪个字节呢？ bipush 指令本 
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身具有值 Ox 】0, 但它后面总是跟一个字节，表明需要压入的是什么。要压入值0,编译器也可 
用 bipush 0,这将被汇编成两个连续的 字节： 0 x 10、0 x 00。这样，我们就有了该程序的另一 
种版本，如表 2-3 所示。注意，这第二个版本大约要加长50%，因此更低效。 


表 2-2 将程序片断#1转换成字节码 



2.3.5 非法操作 

因为堆栈和局部变置都只存储位模式，程序员可能很容易弄混。这尤其可能发生在压入 
常数时，因为常数的类型不是明确地标记在助记符中。将整数值 10 S 于堆栈的命令是 ldc 10, 
将浮点值 10.0 K 于堆栈的命令是 ldc 10.0。由于大多数 JVM 汇编器足够聪明，能够区分出10是 
一个整数而 10.0 是一个浮点数，所以在两种情况下都能将正确的位模式压入到堆栈。 然而， 
这些位梭式是不一样的。试图压入两次】 0.0 然后执行一个 Irnjl 指令将不会得到 100.0 (或者甚 
至100)。试图将浮点数当成整数执行一个算术运算，或者将整数当成浮点数执行一个算术运 
算都是错误的。在最好的情况下，机器会给出 警告。 在最坏的情况下，机器甚至不理会，并 
给出完全错误的答案，而且这种错误是神秘而不可追踪的。 

同样，企图将双字变董、长整数或双精度数当成单字变量来访问其上半部分（或下半部分) 
也是错误的。如果你已经将一个双精度数存储到局部变量#4 (及 #5), 就不能从局部变 (#4) 
装入一个整数。最好情况下机器仍然会给出警告，最坏情况是默默地给出无意义而且极其错误 
的结果。试图从空堆栈弹出、从不存在的变缝装入或存入不存在的变最等等也是错误的。 

JVM 的主要优势之一就是其设计（第三章将会讨论）能够在这类错误发生时，甚至在写 
程序时就捕获它们，使得程序员得以摆脱错误。这就极大地提髙了 JVM 程序的安全性和可靠 
性。然而，一个好的程序员不应该依赖计算机的能力来捕捉错误。精心地规划和谨慎地编写 
代码是确保计算机得出正确结果的更好方式。 

2.4 —个样例程序 
2.4.1 一个有注解的例子 

回到本章开头的圆锥体问题，现在问题就变成我们不仅想知道问题的答案，而且还要知 
道如何在所讨论的机器 ( JVM ) 上实现。简要回顾一下，原问 题是： 














42 第一部分假想计算机 


一个底面直径450米，髙150米的锥形山的体积是多少（见图 2-8) ?这个公式在黑板上可 


以写作: 


斗 n 2 l . 150 

3 [ \ 2 ) 

用什么 JVM 指令序列能解决这个问题呢？ 

首先，我们需要计算浮点值1/3。整数除不行，因为 
1/3等于0,而 1.0/3 等于0.333333。这样，我们将两个元 
素1 .0 和 3.0 压入并执行一个 除法： 



阁 2-8 —个锥形山 


ldc 1.0 
ldc 3.0 
fdiv 




fdlv 之后 


然后压入已知的11值 # 


ldc 3.141593 



ldc 3. 141593之后 


要计算半径，我们只要压入450,压入2,然后再做除法，注意450过大，不能存储在单个 
字节中（单字节最大也只能到整数值 127), 所以必须用 slpush 。 


si push 450 
bipush 2 
idiv 



bipush 2 之后 


要对半径求平方，我们可以重新计算或者也可更高效地采用 diip 指令拷贝堆栈顶 
部元素并执行乘法。 


dup 

imul 



dup 之后 








下面，将髙度150再压入并做乘法。 


sipush 




ipush 150 之后 


inul 之后 


堆栈顶部的整数值必须转换成浮点数，然后两个（浮点）乘法就计算出最终答案并将其 
a 于堆栈顶部。 



i2f 

fmul 

fmul 


之后 

这个过程将被存储成一个机器码指令序列。毎个指令将分別从存储器中取出并执行。由 
于语句是顺序的，下一条要取出的指令就是指令序列的下一条指令，这样，这个复杂的语句 
序列就会按期望的那样工作。在指令集可利用的基本操作范 tM 内，可以用类似的过程完成任 
何计算。 


2.4.2 最终的 JVM 代码 

. 计算 1/3 
ldc 1.0 
ldc 3.0 


压入 pi 


.141593 


« 计算 t - 径 

sipush 450 
bipush 2 
idiv 

, 对其求平方 

dup 

imul 

* 压入高度 
sipush 150 

, 将商度与半径的平方相乘 
imul 

. 转换成浮点数 
i2f 

. 再乘以以前计算出的於 ni/3 


fmul 
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2.5 JVM 计算指令总结 

算术 操作： 

整数 

加法 ladd 

减法 Isub 

乘法 IbuI 

除法 
求余数 
取反 

逻钳（布尔） 操作： 


$ 辑 AND 
mm 
$ 辑 XOR 

移位 操作： 
左移（货 •术} 


右移（算 术） 
右移 （逻 钳） 


idiv 

Irem 

ineg 

螫数 

land 

lor 

Ixor 


螫数 

Ishl 

Ishr 


长整数 

ladd 


ldlv 

lrem 

lneg 

长整数 

land 

lor 


长整数 
lshl 


浮点数 

fadd 


fneg 


双楕度数 
dadd 
dsub 
dmul 


dneg 



lushr 

lushr 



转换搡作: 
从： 

到： 





ft 数 

长軼数 

汴点数 

双精度数 

ft 数 


121 

12f 

12d 

K ： 觖数 

121 


12f 

12d 

浮点数 

f21 

fai 


f2d 

双梢度数 

d21 

621 

d2f 


(将短整数. 

字符及字节转换到整数是隐含和 S 动的） 



短整数 字符 字节 


短 ft 数 字符 字节 

12s 12c 12b 


2.6 本章回顾 

•计算机与计算器一样，只能做其硬件所允许的一些动作。对于不能用眛个操作或按钮点 
击完成的复杂计算，就必须用若干个可允许的基本步骤组成的序列来完成。 

•传统的数学，如写在黑板上的数学计算公式，采用的是中缀表示，其中像除法这样的操 
作符写在两个参数之间。而一些计算器或计算机 UVM 就是其中之一），采用的是后缀 
表示，操作符放在参数之后。 

• 后缀表示可容易地用称为堆栈的数据结构描述和模拟。 

•任何计算机的基本操作都是取指-执行循环，在此过程中，指令被从主存储器中取出、 
解释并执行。这个循环的重复次数没有限制。 

• CPU 拥有为进行取指-执行周期所需要的两个重要 信息： 指令寄存器 （IR) 保存的是当 
前正在执行的指令，程序计数器 (PC) 保存的是下一条要取出指令的地址。 

•计算机有两个基本的设计 思想： 复杂指令集计算 （CISC) 和精简指令集计算 （RISC)。 
Intel 奔腾和苹果 /IBM/Motorola Power 体系结构分别是体现这两种思想的典型实例。 

• JVM 采用有类型基于堆栈的计算来执行大多数的算术操作。助记符描述了要执行的操作 
以及所使用的数据类型。在错误类型的数据上执行一个操作将会产生错误。 


务 2 聿 算术表达 


• JVM 还对经常使用的操作提供了一些快捷操作，比如将值0装入到堆栈。 

• 简单的基本数学操作序列能执行非常复杂的计算。 

2.7 习题 

I. 在计算器上有一个按钮有什么优点？有什么缺点？ 

2•在一个标准的（中缀表示）计算器上，用什么样的操作序列来计算 (7+1) .(8-3)? 在一个 
RPN 后缀计算器上怎么做呢？ 

3. 是否存在相应的采用前缀表示的操作序列来执行上述计算？如果有，是什么？如果没有， 
为什么？ 

4. 取指-执行周期在 CISC 或 RISC 计算机上哪一个运行更复杂一些？为什么？ 

5. 有类型计算与无类型计算之间的差别是什么？分别给出两个例子。 

6. 有类型算术运算的优点和缺点各是什么？ ： 

7. 为什么不存在 cadd 指令？ 

8. 下面的指令哪些是非法的？为什么？ - 

• bipush 7 

• bipush -7 

• si push 7 

• ldc -7 

• ldc2 -7 

• bipush 200 

• ldc 3.5 

• sipush -300 

• sipush -300.0 

• ldc 42.15 

9. 怎样用移位操作将一个整数乘以 8? 

10. 描述两种方式将一个64位长的整数中的琺低8位提取出来。 

II. 存在能在整数和浮点数上都能运行的操作吗？整数和长整数呢？ 

12. 在 ? dl V 指令中，被除数是存储在堆栈顶端还是从顶端开始的第二个元素？ 

13. 球表面的面积是相同半径的圆面积的4倍。写出一个后缀表达式来计算半径为 R 的半球圆顶 
的表面面积。 

14. 写出一个后缀表达式来计算 a 、 b 、 c 、 d 及 e 五个数的算术平均值。 

15. 证明对任意的中缀表达式都存在等价的后缀表达式。反之亦然。 

2.8 编程习题 

1. 写一个程序，实现功能：解释一个后缀表达式并输出结果值。 

2. 写一个程序，实现 功能： 读入一个中缀表达式并写出与其等价的后缀表达式。 

3. 写一个程序，实现 功能： 读入一个 JVM 指令序列，确定执行该指令序列可能导致的最大堆 
栈高度。从空堆栈开始。 

4. 写一个程序，实现 功能： 读入一个 JVM 指令序列，确定其中是否有指令试图执行从空堆栈 
弹出的动作。（注意，这实际上是真实系统的验证器要完成的任务之一）。 
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3.1 Java 编程系统 

就像在 第丨章 所讨论过的，为什么一个用 Java 写的程序要在 JVM 上运行，或者为什么一 
个 JVM 程序不能用像 C ++ 这样的髙级语言写成，在理论上都是没有道理的。在实际上，两者 
之间存在很强的关联，而且 Java 语言的设计已经强烈地影响了 j ava 虚拟机和针对机器的汇编 
器设计。 

特别是， Java 强有力地支持和鼓励称为面向对象程序设计 ( object-oriented programming , 
OOP ) 的一种特定的程序设计风格。颐名思义， OOP 是一种关注于对象的编程技术，对象就 
是这个世界上独立的活动元素（或者说是这个世界的一个模型），每个对象有其自身的一组可 
执行（或者说可于其上执行）的动作。对象又可归组成类 （ class ), 类是相似类型对象的集合， 
可根据其类型共享某些特性。例如，在真实世界中，“汽车”是一个 Q 然的类，几乎很少有例 
外，所有的汽车都共享某些 特性： 它们都有方向盘、油门、刹车以及车前灯。它们也共享某 
些动作：可通过转动方向盘将车左转或右转，通过踩刹车使车减慢，或者由于油耗尽而使车 
完全停下。更着重地说，如果某人说他刚买了一辆新车，你可以假设这辆车有方向盘、刹车、 
油箱等等。 

Java 是通过将所有函数附干类并将所有可执行程序代码存储成单独的（并且可分离的） 
“类文件”来支持这种编程风 格的。 这些类文件与 Linux 的可执行文件或者 Windows 的 . EXE 文 
件有相当紧密的对应关系，区别之处是类文件无须保证其自身是功能完全的程序。相反，一 
个类文件只包含特定类的操作所必需的那些函数。如果它还依赖于另一种对象的性质和函数， 
则这些性质和函数就存储在一个对应于该对象的类中。 

Java 类文件与典型可执行文件的另一个主要差別是 Java 类文件在不同机器类型间是可移植 
的。故此，它不是用宿主机的机器语言编写的，而是用 JVM 的机器语言编写。这种代码称为 
字节码 （ bytecode ) 以表明它不依赖于任何特定的机器。由此，在任何机器上编译的任何类文 
件可自由拷贝到任何其他的机器上并仍能运行。从技术上说， JVM 字节码只运行在 JVM 的一 
个副本上（就像 Windows 可执行文件通常只运行在一个 Windows 计算机上一样），但通过软件， 
JVM 在几乎每个硬件平台上都能运行。 

当一个字节码文件要执行时，要求计算机运行一个特殊的程序将类从磁盘加载 （ load ) 到 
计算机的存储器。此外，这时计算机通常还执行其他一些动作，比如加载支持当前类的其他 
类，验证该类及方法在结构上的完备性和安全性，将静态和类级别的变量:初始化为适当的值。 
幸运的是，从用户或程序员的角度看，这些步骤都内 S 于 JVM 的实现中，所以用户不需要做 
任何車情。 

这样，运行 Java 程序就是3个步骤的过程。在编写完程序源码后，必须将其编译或转换成 
一个类文件。然后用户必须创建一个（软件的） JVM 实例用以执行字节码。做这件事情不同 
系统所用的具体命令不同。例如，在一个典型的 Linux 系统中，执行 JVM 的命令如下 所示： 

java TheClassOfInterest 
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这个命令就会去寻找名为 TheCUssOf Interest .cl ass 的文件，将其装入并进行验证和 
初始化。然后，该命令还将在这个类中寻找一个名为 ma1n () 的方法，并试图调用这个方法。 
由 于这个 原因，任何独立的 Java 应用类必须包含一个“ main ” 方法。在很多其他的系统^ 
(例如 Windows 和 MacOS)， 只要点击与 .class 文件对应的图标就会启动一个 JVM 并运^类文 

件。此外，某些种类文件可直接从 Web 浏览器（如微软的 irnemet Explorer 或网景 Navi g ator) 
来运行。 

但是，这些程序实际上都不是在运行 Java 程序，而只是在运行 JVM 字节码。有许多编译 

器能将髙级 Java 代码转换成 JVM 字节码，并且并不奇怪，也有程序能将不是 J ava 的语言转换成 

JVM 字节码。这里，我们将关注一种特定种类的语言，在这种语言中，每条字节码语句唯一 

地与程序源代码的单条语句相关联。如在第1章所讨论的那样，这种语言（即源代码语句与机 

器指令之 Ih ) A 丨对 1 的关系〉通常称为汇编语言 （assembly language ), 而将一种语言转换成另 

一种语言的程序称为汇编器 （assembler^ (对髙级语言进行相应转换的程序则通常称为编译 
器 （compiler) 0 ) 

3-2 使用汇编器 

32.1 汇编器 

正如所料，汇编语言与机器代码之间的转换是相当直截了当的。相应地，程序本身也相当 
容易写。汇编器的任务非常简单，所以对汇编器我们通常有若干种选择，而且这些选择之间 
的差异非常细微。 Sun 还没有为 JVM 确立一个官方的、标准的汇编器，所以本书中的例子程序 
都是针对 Jasmin 汇编器所写的。这个程序在1996年由纽约大学媒体研究实验室的 Jon Meyer 和 
Troy Downing 编写 e 。 程序 n 了从 http://jasmin.sourceforge.net 免费下栽，并在事实上已经成为 
针对的编语言的标准格式。 jasmin 程序还可以从本书的相关网站以卬^/ prenhall . 
com/juola 得到。这样，首要的步骤就是在你工作的机器上获得和安装 j asm1n •由于 “;州虚 
拟机 if: 编语言”过于冗长难念，为简单起见，我们也将这个语言称为 jasmin。 

3.2.2 运行一个程序 

为了执行图 1-19 中的程序（在这里我们将它复制到图 3-1 中），该程序必须首先被输入成机 
器可读的形式（如一个文本文件）。可以使用任何编辑程序做这件事情，从像 Notepad 这样的 
简单编辑器到复杂而且功能全面的出版用软件包都可以。但要记住，汇编器几乎不会处理各 
种奇特的格式和字体变化，所以要将程序存储成纯文本。根据著者惯例，用 Jasmin 写的程序 
通常用 .j 扩展名存储，所以上面的程序就应以 jasmlnExample.J 存储到磁盘。 • 

为了运行这个程序，就必须遵循与执行 Java 程序相同的步骤。在程序用文本格式编写完 
后，首先必须将其从人可读的 Jasmin 语法转换成 JVM 机器码。其次，必须运行 JVM (Java 
run-time engine) 以使 JVM 码可执行。首先（对干适当配置的 Linux 机器），只要在适当的命令 
提示符后 键人： 


e Jon Meyer 的网站是 hnp : //www. C yberg ra i n . CO m/ (在我写这本书期间 >• Meye^Downmg 还有一本描述 JVM 和 
== 好的书 (不幸绝版⑽ … & 7 W .— 一. Cambridge ， 
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• 定义相关的类文件为 jasminExample.class 

.class public jasminExaaple * 

I 定义 jasmlnExample 为 Object 的子类 
.super java/lang/Object 

. 创建对象所需的样板步骤 
.method public <init>()V 
aload _0 

invokespecial java/lang/Object/<init>()V 
return 
.end method 

.method public static main([Ljava/lang/String];)V 

* 对于 System.out 和字符串，黹要两个堆栈元素 
.limit stack 2 

« 寻找 System.out (—个 PrlntStream 类型的对象） 

. 并将其放入堆栈 

getstatic java/lang/System/out Ljava/io/PrintStream; 

. 寻 找要打 印的串（字符） 

. 并将其放入堆栈 

ldc "This is a sample program." 

I 调用 PrlntStream/prlntln 方法 

invokevirtual java/io/PrintStream/printIn(Ljava/lang/String;)V 

« ... 大功告成！ 



闬 3-1 JVM 汇编语言的样例程序 


这将执行汇编器（就是在该文件上运行 jasmin , 产生一个名字为 jasminExample.class 
的新文件，该文件包含了 JVM 可执行码)。 

这个 . class 文件是 Java 运行时系统的一个标准部分，可用任何通常的方式来运行。 ft 简单 

的方式就是 键入： 

java jasminExample 

这将创建一个 JVM 进程，并在这个虚拟机上执行 jasminExample . class 文件（明确地说 
就是定义在该文件中的 main 方 法）。 

这种或类似的进程对于大多数机器和本书的所有例子都能行得通（当然那些故意含有错 
误的例子除外）。 

3.2.3 显示到控制台还是显示到窗口 

运行3 .2.2 节描述的程序使用了一个相当老式和风格不入流的交互界面。大多数现代的程 
序员倾向于使用窗口界面并通过鼠标点击来与计算机交互，而不愿使用命令行和基于文本的 
接口。 Java 流行的主要原因是其为窗口化和网络化应用提供了广泛支持。然而，这些应用与 
外部世界交互的方式存在微小的差异。 

Java 的最流行的一种 Web 应用称为 applet 。 颐名思义，这是一种小的、相当轻量级的应用， 




是特别为 Web 浏览器互操作而设计的，因而，所有主要的浏览器都支持那些结合了 j VM applet 
的 Web 页。图 3-2 显示了一个非常简单的 Web 页的例子，其中唯一的内容就是一个 < APPLET ># 
志。这个页的效 果是： 当它被显示在一个浏览器上时，浏览器将下载和运行这个 applet 。 运行 
这个 applet 的具体方法是不同的。浏览器不是调用 “ main ” 方法，而是调用一个 “ paint ” 方法 
作为代码的起点。此外，输出指令（比如 println ) 被图形专用指令（比如 drawstring , 该 
指令不仅接受要显示的串，而且还接受该串显示在窗口中的位置之类的参数）代替。 

<HTML> 

<HEAD> <TITLE>A Sample JVM Applet</TITLE> </HEAD> 

<BODY> 

<APPLET code ■ "jasminAppletExanple" width ■ 300 height - 100> 

</APPLET> 

</B0DY> 

</HTKL> 

图 3-2 调用 apple^Web 页 

applet 编程是一门精细的艺术，需要 applet 专用函数的一些知识。利用这些函数，一个熟 
f 的程序员能创建精致的图画，或者所需的任何字体、大小、形状和方向的文本。如图 3-3 所 
示，无论是写成 applet , 还是输出到窗口，或者是写成向控制台输出的独立应用， jasmin 程序 
的总体结构不会改变很多。 

像以前一样，程序 ( jasmlnAppletExample . j ) 将用 jasmin 程序汇编，产生一个类 文件： 

jasmin jasminAppletExample.j 

一旦创建了类文件 jasmlnAppletExample . cUss , 只要打开图 3-2 所示的 Webjf 就可运行 
applet 。 这可在任何 Web 浏览器（例如 Internet Explorer 或者 Netscape ) 中打开，或者用由 Sun 
公司连同 Java 系统一起提供的特殊程序如 appletvlewer 。 利用这种技术， Java (和 jasmin ) 
程序就可作为可执行代码，并由任何地方机器上的 JVM 所使用。 

3.2.4 使用 System . out 和 System.in 

当用任何汇编语言编程时，让计算机读写数据厲于嵌具挑战性的任务之一。计算机读写 
问题与计算机和 I / O 外设进行交互等更一般的问题相关。由于外设类型繁多（从网络读与从键 
盘读有很大的差异），而且更令人烦恼的是，即使给定了外设类型，其中的差异也很大（你的 
键盘有没有数字键区？），所以每个设备就不得不用各自不同的方法来处理。 

Java 的类系统稍微缓和了这个问题。由于所有的车都有方向盘并以相同方式工作，所以 
人们可以驾驶不熟悉的车。同样， Java 定义了 PrlntStream 类，该类包括了名为 print 和 
println 的方法。 JVM 总是定义一个特殊的 PrlntStream , 名为 System . out ， 它附加于一个默 
认的能打印的设备上。 

这就提供了一个相对简单的方法，可以通过 print 或 println 来产生输出。在图 3-1 的简单例 
子中已经演示过打印 String 类型，还可扩展用于打印该方法支持的任何类型（要做一些改动）。 
这里给出的必要步骤大多没有做解释，你不必现在就理解它们。要全面理解这些步骤，就要 
求对 JVM 类型和类系统以及它们是如何表示的等问题有更深入的研究。我们将在第10章再返 
回来更详细地讨论这个简萆例子。 

首先， System . out 对象必须从其在系统中的静态和不改变的位置压入到堆栈。 


其次，要打印的数据必须采用第2章介绍的常用方式装入到堆栈。 



第一部分假想计算机 




.super java/applet/Applet 

I 创建 applet 所需的样板程序 

. 注意与前面例子中 Object 创建的相似性 
.method public <init>()V 
aload_0 

« 这不是 - 个 Object, 所以我们必须调用 Applet <1nit> 
invokespecial java/appl©t/Applet/<init>()V 
return 
end method 


• 注意 applet 开始于 palntO 方法而不是 Mln() 

. 还要注意有微妙差异的定义 
method public paint(Ljava/awt/Graphics;)V 
. 我们炻要 4 个堆栈元索 
I Graphics 对象 
. 要打印的电 

. 打印位》的 x 坐 
* 打印 位置的 y 坐标 
..limit stack 4 

. 存储在兄部变 籃》1 的 Graphics 对象 
.limit locals 2 

. 这个样板程序有点不寻常，因为在 applet 中绘制文本要比在 System.out 上难 
. 装入4个参数 

aload.l , 这是作为参数传递的 Graphics 对象 

ldc "This is a sample applet" j 要打印的申 
bipush 30 , 打印该申的坐 

bipush 50 

, 1*1 用 drawstring 方法 




图 3-3 jasmln 的一个样例 applet 


11oad_2 ; 作为整数装入局部变 ft#2! 

第三，必须调用 println 方法，包括在第二步中压入到堆栈的类型表示。由于语句 iload _2 

压入了一个整数，因此命令 就是： 

invokevirtual java/io/PrintStream/println(I)V; 

如果我们压入的是浮点数（可用 fload_2), 命令就要修改成用 F 替代 I, 如下 所示： 
invokevirtual java/io/PrintStream/println(F)V; 

要打印一个字符串，就需要样例程序中使用的那种复杂的语句。 

invokevirtual java / 彳 o/PrintStream/println(Ljava/1ang/String;)V; 

如果你觉得糊涂，先不要担心。类和类的调用将在第10章详细讨论。现在这些语句可看作 
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一种合法的样板或魔术。每当你要产生输出时，只要使用适当的版本就行了。可以用一组类似 
但更复杂的样板程序从类似构造的 System . i n 对象得到输入，但这个讨论将推迟到我们对类的 
一般槪念有了更好的理解后再展开。现在，理解基本语句在开发 jasmin 程序中更为重要。 

有了最新版本的 Java (Java 1.5), 采用新定义的类如 Scanner 和 Formatter ， 以及新的结构 
化的用于格式化输出的 prlntf 方法，就可以得到一个全新的进行控制台输入和输出的方法。 
从底层汇编语言的角度看，这些都被看作是可调用的新的函数/方法。它们不会牵涉任何技术 
上的根本改变。 

3.3 汇编语言语句类型 

3.3.1 指令和注释 

汇编语言语句可粗略地分成三种类型（特别是，对于 Jasmin 语句也是这样的）。第一种类 
型是指令 ( instruction ), 直接对应于计算机的机器语言或字节码的指令。在很多情况下，这 
些是通过査找汇编器中存储的表而生成的。对应于助记符 iconstj ) 的字节码就是位模式0 x 03。 
此外，大多数汇编器允许使用注释，程序员能够插入提示和设计记录，从而帮助他们自己以 
后能理解现在正在做的事情。在 Jasmin 的一行中，任何在分号 （，） 以后的部分都是注释， 
所以在图 3-1 的前两行都是注释。汇编器忽略注释，就像它们不存在一样，所以在汇编过程中 
注释的内容被跳过，但在源程序中这些内容是可见的（便于人阅读，比如便于正在给你的程 
序打分的教授来阅读)。 

在众多汇编器中， Jasmin 程序在允许程序员自由使用编程格式方面有点与众不同。汇编 
语言程序的语句通常有一个非常老套和不灵活的格式，比如像下面 这样： 

标号： 

助记符 参数 》注释 

助记符/参数组合在前面已经见到，比如在像 11 oad 2 之类语句中。根据助记符类型的不同， 
可以有任意数 fit 的参数，不过零个、一个及两个参数是最常见的情况 • 标号将在第4寒详细讨 
论。现在只斋指出它标记了程序的一个部分，使得你能返回并*复执行一段代码。最后，这 
个老套的语句包含一个注释。从技术上说，计算机永远不会要求你对程序加注释。另一方面， 
你的老师几乎总会要求你加注释，而好的编程习惯也要求你加注释。特别是，多数的汇编语 
言标准通常要求每行至少有一个注释。 

本书和 Jasmin —样，对于注释持有稍微不同的观点。因为 jasmin 程序中用的很多参数都 
是长整数，尤其是字符串参数以及像系统输出这样的标准对象地址，这样，在一行中就没有 
地方再放相关的注释了。对于每行一个注释这个标准，一个更严重的问题是可能会鼓励拙劣 
而无有用信息的注释。 

作为一个例子，请见下面这一行 语句： 

bipush 5 ,将整数 5 装入到堆栈 

这个注释几乎没有告诉程序员任何东西。毕竟语句 blpush 5就是“将整数值5装入到堆栈 
上”的意思。在读到这条语句时，任何程序员即使独自在看也知道这是什么意思。为了理解 
程序，程序员可能还需要了解更宽泛问题的答案。为什么在这个步骤中要将5这个特定的值压 
入到堆栈中（而且为什么要作为整数装入）呢？通过强调语句在更大范围的作用以及成块或 
成组语句的意义，就能使注释更加有用和富含信息。 

bipush 5 ；装入五边形的边数来度董 
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或者，甚至可以写作: 


bipush 


装人五边形的边数来计算周长 


bipush 8 
bipush IB 
bipush 9 
bipush 7 
bipush 2 


依次装入边 1~5 的度 

; 现在将各个边累加在一起 


为此，建议不要肓目遵从“每行一注释”这样的人为标准，而是理性地遵从"注释应该 
有解释性”的思想。而且，汇编语言程序尤其需要很多解释。 


3.3.2 汇编指令 

第三类语句称为汇编指令 （ directive), 是对汇编器本身的指令，告诉它如何执行其任务。 
在 Jasmin 中，大多数的汇编指令都用一个句点 （•） 开头，如样例程序中第三行（即第一个非 
注释行）所示。例如，汇编指令 (. class ) 的功能就是通知汇 编器： 这个文件定义了一个名 
为 jasminExample 的类，因此，要创建的类文件名字就是 jasm 彳 nExample . class 。 这并不直接 
影响将程序转换成字节码的过程（且不对应于任何字节码指令），但它直接通知 jasmin 如何与 
计算机的其余部分、磁盘以及操作系统相互作用。 

在这一点上很多汇编指令可能没有明确的含义。这是因为 JVM 和类文件本身都直接捆绑 
到面向对象结构和类层次。例如，所有类必须绑定到类层次，尤其必须是其他类的子类。（例 
如，梅赛德斯 Mercedes 是汽车 car 的一个子类，而汽车是运綸工具 vehicle 的一个子类，等等。） 
Java 语言是通过这样的方法来实施这一规 定的： 对于任何没有明确提及其在层次中的关系的 
类，默认它是 Object ( Java /1 ang / Object ) 的子类 # jasmin 汇编器强制实施类似的要求，就 
是任何 jasmin 定义的类必须包含一个 . super 汇编指令，以定义这个新的类是哪个超类的子类。 
在各个 Jasmin 程序中，程序员通常可简单地拷贝下面一行而不会有什么 损害： 

.super java/1ang/Object 

其他的汇编指令 （. method、.end method ) 用于定义该类与所有其他对象的相互作用。 
特別是， JVM 所实施的面向对象编程模型要求，从类外部对函数的调用要明确地定义为 
“public 方法”，并且强烈地鼓励所有函数都这样定义。这种定义的细节将在第 10 章做非常详 
细的 i 寸论。 


3.3.3 资源汇编指令 

从 jasmin 程序员的角度看，最重要的汇编指令就是 .1 imlt 。 这个汇编指令用来定义限制， 
或者展开来说就是在一个方法中进行计算可得到多少资源。这是 JVM (作为虚拟机）的状态 
中独一无二而且非常强大的方面，因为方法可按其所需使用任意数厥的资源。 

特別是，一个典型的基于堆栈的微处理器或控制器（例如老式的英特尔8087数学协处理 
器芯片，后来被合并到80486及后续机型成为主 CPU 的组成部分）就只拥有较少的元件（在这 
种情况下是8个）。一个需要多于8个元件的计算就需要将某些值存储到 CPU 堆栈以及如主存储 
器等其他一些地方。程序员必须确保数据按需要移入和移出存储器，失效的代价通常是程序 
出故障或整体功能不正常。增加 CPU 内可利用堆栈空间的数量可解决这个问题，但却会使每 
个 CPU 芯片更大、更热、更费功耗而且更昂贵。此外，改变不同型号芯片之间的基本参数会 
引入不兼容性，使得新的程序不能在老机器上运行。 
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在 JVM 上相应解决方法的特色是干净利落。可以使用汇编 指令： 

•limit stack 14 

这条汇编指令作为一条语句直接放在所定义方法的内部（使用 . method 汇编指令），其功 
能是将堆栈的最大尺寸设置为 M 个整数或浮点大小的元素。（它也能存储7个长整数或双精度 
大小的元素，或者5个长整数/双精度和4个整数/浮点元素，或者任何适当的组合。）类似地, 
在一个方法中 （ int 大小的）局部变 量:的 最大数量可用相关的汇编指令设置为12: 

.limit locals 12 

如果这两个汇编指令中的任何一个被忽略，则应用一个缺省的限制值，这个值足够用于 
单个整数或单个浮点数，却不足以用于更大的类型。 

3.4 例子： 随机数生成 
3.4.1 生成伪随机数 

一个常见但在数学上很复杂的任务（而且是计算机经常要执行的任务）是生成貌似“随 
机”的数。例如，在计算机游戏中，可能有必要将一副牌洗成肤似随机的次序。由于在当今 
计笕机硬件方面有几个根本的限制，计算机实际上没有能力生成随机数（在统计学家们所坚 
持的严格意义上）。作为替代，计算机生成的是确定性的伪随机数据，这些数据虽然在技术上 
来看可预测，但看起来似乎是不可预测的。 

我们在这里关注的是生成均匀分布在 0~ n 这一范围内的随机整数。如果由于某种原因用户 
希望生成随机的浮点数，可以通过简单地将随机整数除以得到。如果 / z 足够大，这种方法 
就对实数在区间[0，1)上的均匀分布给出了一个很好的近似。（例如，如果 n 是999,浮点数就是 
集合 {0.000,0.001,0.002, …, 0.999} 中的一个 0 如果 n 是10亿，最终的数€起来就非常随机。） 
从数学上看，计算机接收一个给定的数（即种子）并返回一个相关但税似不可预测的数。 
通常的做法就是采用所谓的线性同余数生成器 (linear congruential generator ) 0 采用这种方法， 
对于特定的 A c 及 m 值返回的数由下面形式的公式 生成： 

newvalue = (a • oldvalue-k-c) mod m 

例如，因为计算 mod m 给出的最大结果是 m _ l , 所以参数 m 决定了返回的随机数的最大值， 
由此 n = m - l 。 在选择最佳和 c 的取值方面有很多理论研究，所以过多在这方面探究就离题太 
远了。的值必须在每次运行生成器时重新选择，因为 newva / M 的值严格依赖于它。这 
个生成器可*复使用来生成一序列的（伪）随机数，所以对每个程序只需要确定一次种子。 
初始种子的典型来源包括（对程序来说）真正的随机值，如一天的当前时间、进程的 1 D 号、 
鼠标的最近运动等等。 

3.4.2 在 JVM 上实现 

为了在 JVM 上实现这个算法，就要做出一些设计决策。基子实际的原因，的值可 
能要存储在局部变量中，因为其值在每次调用时会发生变化，但是 A c 及 m 的值可以作为常数 
存储和操作。为了简便起见，和 狀的值 都被存储成整数作为一个堆栈元素，但 
那些中间值，尤其是 a 和 c 是大数时，就可能使单个堆栈元素溢出，因此必须将它们存成长整 
数类型。无需多做解释，我们采用可存储成（有符号）整数的最大质数 （2 147 483 647) 作 
为 m 的值，并选择质数2 16 +1 (=65537) 作为 a 的值，5作为 c 的值。 
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计算本身简单明了。上面的表达式 


(a - oldvalue+c) mod m 


可用 JVM (逆波兰法）表 示成: 

因此，适合的 JVM 指令 如下： 

I 计算 a*oldvalue 


oldvalue . 


mod 


Lw 65537 


121 

lmul 


i a 为 2M6+1, 存储成长整数 
. oldvalue ( 假 设） 被存储成局部变 ft#l 
« 将 oldvalue 转换成长整数 
. 做乘法 


. 加 c 

ldc2_w 

ladd 


. c 是 5, 存储成长螫数 
I 加入到 a*oldvalue 


ldc2_w 





. 得到 mod «的余数 
, 装人》的值 
. 取換（求余数） 

,转换回螫数 


newvalue 现在躭留在堆栈顶部 


补充资料 

参数传递、局部变置以及堆栈 

大多数程序要求输入是有用的。 事 实上，大多数函数和方法郝要求输入是有用的。让方法 
获得信息的标准方式是通过参数传递。例如，定义正弦通常要有一个形式参数 （ formalparameter )。 
当使用正弦函数时，相应的实际参数 （ actualparameter ) 就被传递到函数并用于计算。 

JVM 用一种相当奇特的方式来处理这个过程。在传统基于芯片的体系结构中，计算机在 
内存中采用一个共享的“堆栈”来分隔不同程序或函数所使用的存储区域。与之相反 ， JVM 
对每个方法提供了唯一的私用堆栈。这就避免了一个方法闯入并毁坏程序的其他部分所独有 
的数据，从而极大地增强了安全性，却使一个函数向另一个函数传递数据变得困难。作为替 
代的方法是，当一个函数/方法被调用时，参数被 （ JVM ) 置于方法所能得到的局部变量中。 
一般来说，第一个参数被置于局部变董#1,第二个参数被置于局部变量 #2. 依此类推。 

对这个一般规则有3个例外。首先，如果参数太大，不能装入到单个堆栈元素（长整 
数或双精度数）中，就要置于两个连续的元素中（所有后来的元素就要多下移一个元素位 
置）。 其次，这个规则没有考虑局部变量利)。通常对于实例方法 (instance method ), 对当 
前对象的引用将用#0传递。定义为静态 （ static ) 的变量没有当前对象，因此，将第一个 
参数传递到局部变董*1、相，依此类推 * 

最后 . Java 1.5 定义了一个新的参数传递方法，在参数数量变化的时候可以采用。在 
这种情况下，数董变化的参数将被转换成数组并作为单个数组参数传递（可能在#1中）。 
被调用的方法负责确定实际上要传递多少参数，并正确地对其逬行操作。 

在不是 JVM 的机器上使用堆栈进行参数传递的方法将在后续章节讨论特定机器时详细 
描述。 
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通过观察，在这些计算中所需的最大堆栈深度是两个长尺寸（双精度数）堆栈元素，所 
以这可在堆栈限制为4或更多时用任何方法执行。类似地，给出的代码假设存储在局 
部变中。因为变 ft 从0开始编号，这就意味着程序需要两个局部变量。 （ o / dva / M 要存储在 
变量 #1 中的原 因是： 在某些情况下，局部变量 #0 由 Java 类环境所保留。） 

为了使这个程序正确运行，包含这个代码的方法需要两个汇编 指令： 

.limit stack 4 
.limit locals 2 

这个代码有几个变型，它们也能工作。像大多数的编程问题一样，存在若干个正确的解 
决方案。最明显的是，两条汇编指令可颠倒次序，先定义局部变 ft 再定义堆栈大小。更复杂 
的变化是采用不同的操作次序来进行计算，也 许是： 先压入 C , 做乘法，然后做加法。从技术 
上说，这就是实现等价但不同的逆波兰表 达式： 


c a oldvalue • +m mod 

如果选择了这种实现，则堆栈的最大深度就是3个长元素，需要一个 .limit stack 6汇编 
指令。 

类似地，执行很多小的步骤也有一些等价的方式。如果不是（用 ldc 2 _w 5) 将值5作为长 
整数直接压入，程序员也可以（用 1 const _5> 将值5作为整数压入，然后再（用 121) 将其转 
换成长整数。这会将一条指令换成两条，但这两条替换成的指令可能更短且执行更快。然而， 
像这样的微小改变很少能对程序的大小和速度有 1 R 大的影响。更常见的情况是，这些只是执 
行相同任务的不同方式，并有可能使新手程序员不知所措，因为他往往期望对一个给定问题 
只有一个解。 

3.4.3 另一种实现 

不但上面提到的随机数生成问题有多种解决方案，而且有很多不同的算法和参数能解决 
这个问题。仔细地考察 JVM 的表示方案，就可以得出优化的而且更复杂的随机数生成器。特 
别是，由干涉及整数的数学运算总是采用32位的 ft 来执行，将数对2 32 取模就是自动进行的。 
通过将 m (隐 含地） S £ 为2«,程序员就能避免涉及取模这部分计算。而且，如果所有的计算 
都隐含地以这种模的形式来完成，就不斋要使用长尺寸的存储器或堆栈元素。 

采用这种模能产生好的随机数生成器的一组 数是： Sfl 为69069, Sc 为0。（这些数实际上 
是由研究者 George Marsaglia 所提出的“极高超” ( Super - Duper ) 生成器的一部分。）特别是将 
eg 为0还会简化代码，因为无需做加法。所得到的代码将短小、简单而且优雅。 

I 计界 a • oldvalue 

ldc2_w 69069 • 为 Super-Duper 提出的，作为 a 的怵 

Hoad- 1 , 假设 oldvalue 存储为局部变 ftl 

imu1 . 做条法 （隐 含地取 2 A 32 模） 

.newvalue 现在就在堆栈顶部 

那么，哪个随机数生成器更好呢？比较生成器的优劣可能是非常困难，并可能涉及相当 
高强度的统计计算。此外，根据你的应用不同，线性同余法一般会有一些不好的性质。而且， 
根据使用生成器的方式不同，结果的某些位可能会比其他位更随机。例如，如果是奇 
数，第二个生成器就会总是生成奇数，否则就会总是生成偶数。只使用高序字比只使用低序 
字会给出好得多的结果。对这些生成器所产生&的质量比较时，最容易的方式是将它们都在 
计算机上实现，且都运行几千、几百万或者几十亿次，并根据所期望的用途接受统计检验。 

从速度的角度看（而且更重要地，从计算机组成和汇编语言课程的角度看），显然第二种 
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随机数生成器会运行得更快。不仅是因为它涉及了更少的操作，而且因为这些操作本身会按 
整数运算来运行，因此比第一个生成器的长操作速度快。 

3.4.4 与 Java 类交互 

(这一节可跳过而不影响连续性，假设你具备一些 Java 编程知识。） 

既然这样，为什么要假设种子 ( oldvalue ) 存储在局部变量#1中呢？这直接关系到方法如 
何用 Java 实现以及 JVM 如何处理类之间的对象和方法的相互作用。特别是， 一 旦一个对象的 
方法被调用， JVM 就以局部变置州传递对象本身（作为引用类型变量来传递，因而在操作助 
记符中就以 a 打头），而各种方法参数則以局部变量#1、#2、#3等等依次传递（根据需要可以 
有任意数量的变量/参数）。 

为了正确地运行，上面描述的第二个生成器就要置于一个至少有两个堆栈元素和至少两 
个局部变量（一个用于对象，一个用于种子值）的方 法中。 一个完整的 jasmin 样例程序见图 
3-4, 该程序定义了一个特殊的类 ( jrandGenerator . class ) 和两个方法，一个用于对象创建， 
另一个用于通过上述的第二种方法生成随机数。 


* 定义 jrandGenerator 作为 Object 的一个子类 

I 定义 *5 此相关的类文件为 jrandGenerator.class 
.class public jrandGenerator 
.super j ava/lang/Obj ect 

.W 准步骤，与前向'一样 
.method public <init>()V 
aload.O 



.end method 


. 定义一个 GenerateO 方法，接受整 数并返回整数 
.method public Generate(I)I 

. 为计算，我们 X 要两个堆栈元索 
.limit stack 2 

. 我们还婼要两个局部变 ft, 其中 #1 保存参数 

, 由？ 1 这是一个 知准的 方法， #0 会由 Java 本身设 ® 

.limit locals 2 

. 计算 a*ol(Lvalue ( 并 存储在堆栈顶部） 
ldc 69069 , 作为 a 的值 

iload.l . oKLvalue 假设 存储为 局部变 ftl 

inu l . 做乘法（隐含地完成 mod 2M2 运算 ) 

, nevcvalue 被存储在堆栈顶部.作为整数返回 
ireturn 

.end method 


图 34 Jasmin 中完整的随机数生成过程 

该程序的结构与先前打印一个字符串的程序有紧密的对应关系。然而，与先前程序不同 
的是，没有定义 niainO 方法（不要求 jrandGenerator 类是一个独立的程序）。它要求的是多个 
局部变量（定义在 . limit 汇编指令中），另外 Generate 方法的参数和返回类型已经改变，以反 
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映其作为随机数生成器的用途。 

当用 jasmin 程序进行汇编时，结果将是一个名为 jrandGenerator . class 的 Java 类文件。 
在 Java 编程环境中，这个类的对象与其他任何对象一样创建和使用，如图 3-5 所示。这个简单 
的程序只是创建了一个 jrandGenerator 的实例，并在其上连续快速地调用10次 Generate 方法， 
因而生成了 10个随机数。 



类似地可写一个程序生成1千万个随机数，或者调用一个不同的生成器（实现前述的第一 
个随机数生成方法）。 


3.5 本章回顾 


• JVM 与高级编程语言 Java —起设计，因此支持一种类似的面向对象的程序设计 （ OOP ) 
风格。虽然并非必须在 Jasmin 编程中使用 OOP ， 但这通常是一种好的想法。 

• Java 程序和 Jasmin 程序必须都转换成 . class 文件后才能由 JVM 执行。 

•将 jasmin 程序转换成（本书中用到的）类文件的命令通常命名为 jasmin 。 在写这本书 
的时候，可以在1011\^%1'的\\^)站点或相关的\^1)站点訧1? : //^^6他311. com / juola 
上免费得到。 

•由于有大董不同的设备，所以输入和输出是典型的困难问题。 Java 和 JVM 通过使用类系 
统来简化这个问题。通过熟记三条正确的 jasmin 语句，程序员就能在任何时间将（任何 
类型）数据发送到标准输出。 

•汇编语言语句可分成3种主要的 类型： 指令（要被转换成字节码机器指令）、注释（被计 
算机忽略）以及汇编指令（要影响转换/汇编过程本身）。 

• 汇编指令用于定义类文件如何嵌入到标准 Java 类层次中。 

•汇编指令，尤其是 . limit 汇编指令，也用干控制方法和函数所能得到的资源数量。特别 
是 .limit stack X 要设置最大堆栈尺寸，而 .limit locals Y 要 设置局 部变景的最大 


3.6 习题 

1. 编译器和汇编器的区别是什么？ 

2. 列出至少5条只需一个参数的指令（助记符）。 
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3. 计算机如何辨识出一个给定的行包含的是一个汇编命令、一个注释还是一条指令？ 

4. 如果你忘记了 . limit 汇编命令，你的 jasmin 程序还能工作吗？ 

3.7 编程习题 

1 •写一个 jasmin 程序，将下面的诗显示在一个 Web 页面上。 

There once wad a lady named Nan 
Whose limericks never would scan 
When she was asked why 
She replied with a sigh. 

“It’s because I always try to put as many syllables into the last line as I possibly can” 

2 . 写一个 jasmin 程序，显示如下所示的由大写 O 组成的三角图案。 

0 

0 0 
0 0 
0 0 
0 0 
00000000000 

3 •写一个 jasmin 程序，用以下格式显示今天的 日期： Today is Monday, 9/19/2008 0 
4 •写一个 jasmin 程序，计算并 显示在 下面情形下我应得的 报酬： 这个月，对于每小时薪金 
25.00 美元的工作我的工作时间是 80 个小时，对于每小时薪金 15.50 美元的工作我的工作时间 
是 40 个小时，对于每小时薪金 35.00 美元的工作我的工作时间是 45 个小时。 

5•波音 777-300 飞机的锒大栽客妖为386。写一个程序，确定为了承载/ V 个人做环球旅行，你需 
要包租多少架飞机。你可以在程序中用一个特定的 W 值，（注 意： 飞机按架包租，不允许包 
租一架飞机的五分之三 J 

6. 2 月 29 日这一日期毎 4 年只出现一次。例如，在 2000 年、 2004 年及 2008 年出现。如果我的一 
个朋友出生于 1980 年 2 月 29 日，而当前的年份是 Y ,, 写一个程序，告诉我他实际上已经有多 
少年能庆祝生日。（你可以假设他今年没能庆祝生 日。〉 

7 . 与圣诞节不同（总是在 12 月 25 日），复活节每年的日期都不一样。《自然》 e 杂志的一位匿 
名记者发表了确定复活节日期的算法。（这个算法后来被米斯郡主教 Sarnud Butcher 证明是 
正确的，因此被称为 Butcher 算法）。所有值都是整数，所有除法都是整数除，且 mod 的意思 
是整数取模（除法后的余数）： 

• 设 y 为相关年 
• 设^为夕 mod 19 
• 设办为 100 
• 设 c 为 y mod 100 
• 设 d 为 

• \ie%b mod 4 
• 獻为(_/25 
• 设客为0-/+1)/3 


© 《自 然 》 - April 20,1876. vol. 13. p.487. 
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• 设办为 (19 • a ^ b — d — g +\5) mod 30 
• 设1•为 c /4 
• 设々为 c mod 4 

• 设/为 (32+2 • 亡+2 • i - h - k ) mod 7 

•设饥为 ( a +11 • h +22 - 1)/451 

• 设 p 为 f / i +1— 7 • m +114) mod 31 

•复活节月是0+1-7 • m +114)/31.(3=3 月，4=4 月). 

• 复活节日是 P +1 

实现这个算法，确定下10个复活节的日期。 


第 4 章控制结构 


4.1 他们教给你的都是错误的 

4.1.1 再谈取指 -执行 

在第2章和第3章中，我们探讨了如何用 JVM 的基干堆栈的计算写出复杂的数学表达式并 
对其进行求值。通过将参数压入计算堆栈并执行适当的基本操作序列，就能使计算机或多或 
少地按人的吩咐进行工作。从实用化的观点看，计算机的真正优势是其拥有这样的能力，即 
它能不厌其烦或正确无误地反复执行任务。 

回顾 JVM 的表示结构，不难看出如何使计算机反复执行相同的代码模块。记住，程序代 
码是由连续的机器指令组成的，在计算机的存储器中存储为连续的元素。为了执行一个特定 
的语句，计算机首先从存储器中取出当前指令，解释并执行该指令，然后更新“当前指令” 
的标志。正式地说，当前指令就是一个存储在程序计数器 （ PC ) 中的数，指向当前方法字节 
代码的位 S 。 每次取指-执行周期发生，存储在 PC 中的值就增加1个或更多字节，使得它指向 
要执行的下一条指令。 

为什么是1个“或更多”字节呢？难道 PC 不应该每次增加1吗？事实上不是这样，因为一 
些操作需要多个字节来定义。例如，像 irem 这样的基本算术操作只需要1个字节来定义。然而， 
像 bipush 这样的操作用1个字节就不够了。 blpush 规定要将1个字节压入到堆栈（并被提升成 
为32位整数），但它本身并不规定要压入哪个字节。一旦使用了这条指令， bipush 的操作代码 
(0 x 10) 后面就要跟一个要压入的字节。正如所料， slpush 指令 (0 x 11) 后面跟的就不是1个 
而是2个要压入的字节（是一个短整数）。类似地， iload 指令后跟1个或2个字节，描述了要装 
入的局部变量。相比之下， noad _ l 快捷操作 ( OxlB ) 自动地装入局部变量#1，这样就能用1 
个字节来表示。 

由于操作大小是变化的，为了取出全部的指令及其所有参数，取指-执行周期就需要足 
够聪明，能一次或依次取出可能的若干个字节。 PC 的更新必须反映取出指令的大小。一旦这 
些困难得到处理，将 PC 设置为适当 位置就 能使得 JVM 自动地执行指令序列。因此，如果有强 
制 PC 包含某个特定值的方法，就能使计算机反复执行那个代码块。通过控制 PC ， 就能直接控 
制计算机做什么以及做多少次。 

在后面的几个小节中，这种直接控制就等价于常遭蔑视的 goto 语句。常常告知并一直灌 
输学生们的是避免使用这种指令，因为与控制方便的程序块的相比它们会引入更多的错误。 
在高级语言中，学生们在学习编程方法时被告知要避免使用 goto 语句。在汇编语言一级，就 
赤手空桊了，我们能做的最好事情就是理解它们。 

4.1.2 转移指令和标号 

任何可能导致 PC 改变其值的语句通常称为“转移”指令。与正常的取指-执行周期不同, 
一条转移指令可能转到任何地方。为了定义目标位置， jasmin 像大多数其他的汇编语言一样， 
允许单个指令接受标号 （ label ), 使其能作为个体被引用。不是所有的指令都会得到这样的标 
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号，但任何语句都能得到。要调整 PC , 可以使用适当的语句，然后给出目标指令的标号。 

那么，一个转移语句是如何生成和存储的呢？更详细地说，就是什么是“标号”？标号 
如何被存储成位的序列，像一个数或机器指令那样吗？从程序员的角度看，标号就是一个独 
立的一行，可以保存或不保存任何指令，标号本身是一个标记了指令的字（由字母和数字组 
成，以字母开头，按惯例是大写字母，后跟一个冒号[:】）。要将控制传递到一个给定的位置， 
就要在一个适当的转移语句中使用标号（不加冒号）作为参数。 例如： 
goto Somewhere , 将 PC 的值设*为 Somewhere 的位 B 

4.1.3 结构化 编程： 转移一下注意力 

从机器设计的观点看，控制 PC 的最简单的方式就是将其作为一个寄存器或局部变量来看 
待，并为之指定适当的值（见图 4 -1)。当一个特定的值被放入到 PC 时，机器将转移到那个位 
置并开始执行代码。 

这当然就是无限度地滥用 goto 语句。 

. 做一哼计算 
. 再做一些计算 

goto ALabel , 现在将控制直接传递到 ALabel 
«这条语句披跳过 
. 这条 语句也 被跳过 
ALabel : 

. 伹我们从这里的语句开始 
. 并以止常的方式继续运行 



图 4-1 执行了一条 goto 语句的取指-执行周期 

根据现代程序设计的实践（大约1970年以来以及 Dijkstra 的非常有影响的工作），使用 goto 
语句的编程遭到严厉的责难。一个原因就是无保护的 goto 可能是危险的。将一个随机的位置放 
入到 PC 将会导致计算机执行存储在那个位置的任何指令。如果那个位置是计算机代码，还算可 
以。如果那个位置恰好（比如）处于存放串变量的存储位置中间，计算机就会将串的各个字节 
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看成是程序代码并开始执行。（例如，在 JVM 中， ASCII 字符65 ( A ) 对应于 lstore _2, 就会导 
致计算机试图从堆栈弹出一个长整数。如果堆栈顶部没有这样的长整数，就会引发程序崩溃)。 

一个潜在的更严重的问题是带有 goto 语句的程序会引起混乱并因而易于出错。从作为 goto 

目标的语句的角度看，在程序的形象结构、字节码级的程序语句顺序以及程序语句的执行顺 

序之间没有明显的关系。请看下面的简单语句 序列： 

iload 一 1 
iload_2 

Branch: 

iload. 3 
iadd 

imul • 

该序列可能并不像不经心的读者所想的那样，因为代码可能通过一个 goto 语句转到第3个 
11 oad _ N 语句来执行〃这样，存储在局部变董#3中的值被加入到（并被乘以）某个并不明确的 
值。在特别糟糕的情况下，控制结构可能是完全混乱的（通常被比喻成意大利式细面条），存 
在导致程序员混乱的所有常见问题。 

由于这个原因，现代“结构化编程”推荐使用髙阶控制结构，如块结构的循环和判定语 
句。然而，在机器代码级别，任何反映不同计算的变化必须通过对 PC 的变化表达出来，这样 
就要求有一个隐含的 goto 。 

那么，为什么希望程序员不用 goto 语句来编程呢？结构化编程的思想不是完全避免使用 
goto , 而是限制其在不会引起混乱的场合使用。特别是，程序应尽可能模块化（由逻辑上分 
开的代码片断组合而成，这些代码片断在槪念上可作为单个操作看待）。这些模块应尽可能有 
单一的起始点和单一的退出点，理想佾况是起始点和退出点分別在实际代码的顶端和底端。 
(这常常被规范化为“单入口/单出口”原则，作为结构化编程定义的组成部分）。高级语言经 
常通过其设计防止违反单入口/单出口规则。大体上，同样的原則能够也应该应用到汇编语言 
编程中。虽然语言本身会给你灵活性以至于做出非常愚蠢和混乱的事情，但训练有素的程序 
员会抵制这种诱惑。熟悉高级控制结构（如 if 语句和循环）的程序员会努力使用类似的易于理 
解的结构，甚至是在 Jasmin 中，使得他们及其合作者能够准确地领会程序的意图。 

4.1.4 髙级控制结构及其等效结构 

一个简单的例子有助干阐明这一点。图 4-2 和图 4-3 分别用 Java / C ++ (还有很多其他语言） 
和 Pascal 给出类似的循环例子。两个例子实现的都是从100计数直到0,在每次循环都会做一些 
聪明的事情。做聪明事情的模块是用最高效的方式写成的连续一组机器指令。当装入了这组 
指令的首条指令的地址时，整个模块就将被执行。 


为了执行这个模块若千次，计算机需要在每次模块的起始点决定该模块是否还需要再 
(至少）执行一次。对干图中循环的情况，决策很容易 做出： 如果计数器大于0,则模块应再 
次执行。在这种情况下，就转到模块的开始处（并递减计数器），否则，如果计数器小于或 
等于0,就不再执行循环并转移到程序的其余部分。 

非正式地，这可以用简单的 pop - and - if - XKgoto 来表达。正式地，这个特定操作的助记符 


for i :- 100 downto 1 begin 

{ 做 100 次聪明的事情 > 
end 


图 4 -3 用 Pascal 写的等价示例 


for ( 1 - 100 ; i > 0 ; i—) { 

// 做 100 次聪明的事情 


图 4-2 用 Java 或 C ++ 写的循环示例 





。 将循环正式转换到 j 


，结果如图 4-4 所示。 


ldc 100 

. 装人整数 100 ( 循环次数） 

1 store 一 1 

. 将索引作为整数存储到#1 

LoopTop ： 

. 做一些特别聪明的事情 

. 使用所黹要的局部变 ft 

11 oad_l 

. 从#1 A 新装人循环索引 

1 const—ml 

1装人 -1, 用于减法 

ladd 

. 循环索引递减 

istore^l 

. 存储 ... 

11 oad_l 

.... 并盪新装入循环索引 

Ifgt LoopTop 

. 如果准栈顶部 >0. 就将 LoopTop 放入 PC 

. 否则，不再循环 

. 并重复 


图 4- 4 一个用 Jasmin 写的（几 乎） 等价的循环示例 

实际上，这不是一个完全准确的转换。只要循环索引的初始值大于0,它就会正常运行。然 
而，如果程序员规定的循环起始值是负数（如 for ( i =~ l ; i >0; i ++)) f 则用 Java 或•写的循环将 
永远不会执行。 jasmin 版本仍能执行一次，因为在计算机有机会检测索引是否足够大之前，做聪 
明亊悄的计算已经执行了。更准确的转换需要更巧妙或者至少更有变化性的判定和 goto 语句。 


4.2 goto 的类型 
4.2.1 无条件转移 

圾简单形式的 goto 就是无条件转移 （unconditional branch ), (就是 goto 语 句）， 该语句总 
是简单地将控制转移给被指定为参数的标号。该语句本身能产生无限循环（永远运行的循环）， 
而不是只运行一段时间然后在某些情况改变后就中止的循环。为此，程序员就需要条件转移 
(conditional branch ), 就是可能发生也可能不发生的转移。 

4.2.2 条件转移 • 

JVM 支持6种基本的条件转移（有时称为“条件 goto ”）， 再加上若干种便捷操作和另外两 
个转移（将在后面与类/对象一起描 述）。 一个基本的条件转移是通过从堆栈中弹出一个整数， 
然后确定这个弹出的整数是大于、小于还是等于0。如果所期望的条件满足，控制就转移到指 
定的标号。否则， PC 像往常一样递增并将传递到下一条语句。用3种可能的比较结果（大于0、 
小于0或等于 0), 就能指定所有7种有意义的组合。这些在表 4-1 中做了总结。注意 goto 语句不 
改变堆栈，而 If ?? 操作都弹出单个整数。 

表 4-1 jasmin 中的条件和无条件转移操作 


助 id 符 



(goto) 


top>0 


X 





top<0 


X 

X 



解释 

如果等干就 goto 
如果不等干就 goto 
如果小干鱿 goto 
如果大子或笼于就 goto 
如果大于就 goto 
如果小于或等于就 goto 
( 总是 goto) 
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4.2.3 比较操作 

如果基本条件转移只在整数上操作，那么如何完成其他类型的比较？其他类型的比较是 

通过定义成返回整数的比较操作来完成的。例如，操作〗 cmp 弹出两个长整数（像往常一样， 

两个长整数^成四个堆栈元素），并根据第一个元素是否大于、小于或等于第二个元素 （就是 

堆栈顶部的元素）而压入1、0或者-1。例如，下面的代码片断就将存成长整数的局部变量打 

与数 1 进行比较，当且仅当存储的值较大时就将控制转移到 Somewhere: 

J load - 3 . 装人局部变味 #3 ( 及 #4> 

1 consul , 将 1 作为整数压入，用于比较 

lcmp . 比较大小，压入整数解 

ifgt Somewhere • 如果 *3>1 ，转到 Somewhere 

. 如果运行到了这里，則 #3 < = 1 


在堆栈按序操作中有非常重要的一点。指令序列 lload _ l 、 
部变摄接着压入#3/#4,然后再做比 
较。比较操作对顺序是敏感的，如果是#1/#2 
在堆栈的顶部，就会给出一个不同的结果。 

要记住这个次序，只要这 样想： 从堆栈顶部 
第二个元素减去堆栈顶部元素。压入的结果 
就是这个差的符号（+丨、0或-1)。见图 4-5 
的例子。 


L 3、 〗cmp 将首先压入局 



lcmp 



图 4-5 lcmp 指令示意图 


比较浮点数和双精度数是类似的，但因为 【 EEE 表示的复杂性，使这个问题有点棘手。具 
体说，就是 IEEE 7 M 允许用某种特殊的位模式来表示“不是一个数”，简写为 NaN 。 这些特殊 
的模式在实质上 意味符 先前在某处的计算是完全错误的（如试图对复数求平方根或者用0除0)。 
通常与 NaN 进行比较没有意义，但程序员有时有一个特殊的解释。 

例如，假设一个学院定义一个优等生列表，包括了所有平均分 (grade point average , gpa ) 
在 3.50 以上的学生。为了确定一个学生是否在这个优等生列表中，用 Pascal 编写的一个简短程 
序片断如下 所示： 


if (gpa > 3.50) then 

onhonorslist :■ true; 

一个没有 gpa 的学生（例如，第一学期的学生或因病各科都未完成的 学生） 将不可能在优 
等生列表的考虑 之内。 换句话说，如果一个学生的 gpa 为 NaN ， 将被视作小于3.50。然而，这 
个学生不应因 gpa 太低而被开除。 NaN 应该比适当的下限分数髙。 JVM 和 jasmin 提供了两个不 
同的比较指令来定义这些情况。指令 fcmpg 比较堆栈顶部的两个浮点数，并根据结果将1、0 
或-1压入，例外情况是若两个数中有 NaN , 则结果是1。而若两个数中有 NaN , fcmpl 则返回-1。 
同样，比较两个双精度数的类似指令是 dcmpg 和 dcmpl ,这两个指令的行为也存在类似差异。 
上面 Pascal 片断的 jasmin 等价程序大致 如下： 
fload.l , 从 # 1 作为浮点数装入卯 a 

ldc 3.50 • 装入卯 a 下限分数 (3.50) 

fcmpl , 将卯 a 与下限分数比较， NaN 是 - 低 ” 

ifle Skip , 转到 Skip, gpa>»T 限分数 

Iconst.l ,压入 1 ( 布 尔值： true) 

1 const _2 ，将 -true" 放人到 #2 ( 作为整数 / 布尔数） 

Skip: ,做需要对该学生做的其他事情 
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4 . 2 . 4 组合操作 

如前所述，像短整数和布尔数这样的二类类型并未直接得到支持，在计算中必须作为整 
数类型看待。更奇怪的是， jasmin 没有提供一种方式来计算比较两个整数的 结果！ 替代方法是, 
比较是通过一些将比较操作与内罝的条件转移相结合的快捷操作来完成的（如表 4-2 所示)。 



表 4 - 2 在 jasmin 中比较/转移指令的组合 

如果第二个元素等于栈顶元素則转移 
如果第二个元素不等于栈顶元素則转移 
如果第二个元素小于栈顶元索則转移 
如果第二个元素大干或等于栈顶元素则转移 
如 果第二 个元素大干栈 m 元素转移 
如果第二个元素小于或等子栈顶元素则转移 


所有这些操作的原理差不多是一样的^ CPU 首先从栈中弹出两个 int 型元索，然后像 icrnp 
指令那样进行比较，而比较结果不是压入栈中，而是程序通过修改程序计数器立即跳到（或 
不跳） 接近的位置。 


4.3 建立控制结构 


在高级语言中，控制结构的主要优势是相对来说容易理解。在 （JVM 或任何其他计算机 
上）进行汇编语言编程时尽量最大程度地保持这种易于理解性也是有益的。这样做的一种方 
法就是维护一个类似的代码逻辑块结构，像商级控制结构一样组织。 


4 . 3.1 if 语句 

对 4 .2.3 节关于在 jasmin 中如何表达高级控制的例子进行扩展，编写无错误和易理解代码 
的关键是保留一个类似的模块结构。传统的 if/then 语句有至多三个 部分： 一个布尔表达式，该 
表达式求值为真时要执行的一组语句，为假时要执行的另一组语句。这个0+或 Java 块是： 

if Ca > 5) { 

// (if 模块） 

// 做一咚亊情 

n " 黹要儿行 

} else { 

// (else 模块） 

• // 做其他一些事情 

//怎要几行 

> 

//做需要做的其他任何操作 


上述模块可用 jasmin 写成如下等价的樓块（假设 a 是在#1中的一个长整数 型）: 

lloadj • 如果 a 在#1中 

ldc - 2 5 ,装人5 

lcm P . 比较 a 和5 

ifle Else 

,如果运行到了这里，則 a > 5,因而执行的是 If 子句 
,在子句结朿后，跳过 e 〗 se + 句 
. 要通过一个无条件 floto 跳过 
. 这对应于前面的 If 搜块 
goto Quit 

E1S€ * . 如果运行到了这里，則 a <= 5,因而执行的是6〗 $ 6子句 
• -这对应于前面的 else 模块 

Quit : 

,做黹要做的其他操作 
. 一一这对应于前面 if 语句后面的语句 
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这个代码和髙级代码之间在模块结构上的相似性应该是显然的。特别是，在两个代码示 
例中都有相对于 if 模块和 else 模块的连续的指令，这些指令按序从头至尾执行。 jasmin 在这些 
模块之间插入代码并按此设置 PC 。 在细节上，要注意这个例子中的测试有点不同，即在条件 
的反面成立时，不是直接转移到 if 子句，而是跳过 if 子句（到 else 子句）。 

复杂的布尔条件可通过适当地使用 land 、 lor 以及其他指令，或者通过反复的组合来解决。 
例如，我们可用如下程序来检验 a 是否处于5和10之间 （ a >5 且 a <10) 的 范围： 


lload_l I 
ldC -2 5 , 
lcmp 

lfle Else 


如果 a 在 #1 中 
装人 5 
比较 a 和 5 


如采运行到了这里，則 a >5 
1 . 如果 a 在#1中 

: -2 10 ,装人 10 

lcmp I 比较 a 和10 

ifge Else 

. 如果运行到了这里，則 a > S 且 a <10 


. 程序如前继续 


4.3.2 循环 

在很多编程语言中有两类基本的 循环： 程序在开始时测试条件的循环和测试在结尾测试 
条件的循环。第二种已举例说明。我们保留循环的内部模块结构，在模块的顶端置一个标号， 
然后在条件不能使循环退出时跳回到这个顶端。程序大致 如下： 

LoopTop : , 完成与循环相关的操作 

iload_l . 装人要比较的第一个操作数 

iconst_ml . 装入要比较的第二个搡作数 

ifne LoopTop . (该循坏持续进行苴至 #1=- 1 > 

. 纺余循环 

这个程序实现的就是 Pascal 中的 repeat 循环，或者是 C 、 C ++ 或 Java 中的 do/whi 1 e 循环。 
对于更传统的 while 循环，条件 H 于循环体的前面，循环体后跟一个无条件 goto 。 如果循环退 
出条件满足，控制就被转移到循环外的首条语句，如下 所示： 

Control : 

iload.l • 装入比较的第-个找作数 

iconst_ml , 装入比较的第二个操作数 

ifeq LoopOut , (该循环持续进行直至 #1 = - 1 ) 

. 完成与循环相关的操作 

goto Control , 循坏后，跳转并重新桧测条件 
Lo ° P ° ut: , 你只能通过上面的条件转移运行到这里 


这个代码片断执行的是与 while (1 != 1) 等价的循环。还可以采取另外一种方式，就 

是保持 do / while 结构，但在底部通过一个无条件转移进入循环，如下 所示： 

goto LoopEnd . 直接跳 转到循 环测试 
LoopTop : ,完 成与循 环相关的操作 


LoopEnd : 



iconst__ml 
ifne LoopTop 

. 结束循环 


装入比较的第一个操作数 
装人比较的第二个搡作数 
(该循环持续进行直至#1=-1) 


这就节省了一条 goto 语句的执行。 
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while 和 for 循环的等价性已众所周知。一个由计数器控制的循环如下 所示： 

for (i*0;i<10;i++) 

//做一些亊情 

该循环等 价于： 
i * 0; 

while (i<10) { 

// 做一些事情 

i ++； 

} 

这样也就能容易地用上面的框架写出。最重要的改变是需要用一个局部变釐作为计数器， 
要不是这一点不同， while 结构就几乎是完全重复的。 

bip U Sh 0 ,采用 #1 作为 1, 初始时设为零 

istore_l 


LoopTop : 


goto LoopEnd , 茛接跳转到循环测试 
,完成与循坏相关的拗作 


* #1递增 




iadd 



. 从#1中装入1 
. 装人1,用于递增 
,我们埂在已经完成 fio 
.... 并将1存入到幻（再一次) 


LoopEnd : 


,为提髙效率， i : 面四行蛘用一个操作代籽： line 1 1 


■Hoad-l , 装入比较的第 一个掇作数 （ i) 

b^ush 10 • 装入比较的第 二个 提作数 （ 10) 

ifle LoopTop , (该循环持续进行直至 #1«-1> 
. 只有当 #1 >» 10 时结 束循坏 


4.3.3 转移指令的细节 

从程序员的角度看，采用 goto 语句和标号是相当简单的。在你希望控制跳转到的地方加 
一个标号，程序就自动地跳转到那里。在简单的外表下，其内部的实现却更复杂一些。计算 
机实际上存储的不是标号，而是偏移 （ offset )。 例如，在字节码中， goto 指令（操作代码 
0 xA 7) 后接一个带符号的2字节（短）整数。这个整数就是用作为程序计数器的改变撤。换 
句话说，该指令执行后， PC 的值就变为 PC + offset 。 如果偏移值是负数，其效果就是将控制 
移回到以前运行过的语句（就像前面的敢复循环的例子中所 示）， 而如果偏移值是正数，程序 
就向前跳（就像 If / then / else 例子中所示）。在理论上，用值为0的偏移是完全可以的，但这 
意味若该语句没有改变 PC ， 因此会产生无限循环。一个为0的偏移对应于下面的 jasmin 语句： 

Self : 

goto Self 

这也许不是程序员想要的。 

那么，程序员是如何计算这些偏移的呢？幸运的是，他根本就不用计算。这是 jasmin 之 
类的汇编器的任务也是它的主要优势。程序员只要简单地使用就可以了，确定偏移应该是多 
少是汇编器的任务。对于这种实现还有一个潜在的更严重的问题（仍以程序员的角度看），就 
是只有2个字节的（有符号）偏移，不可能有比大约32 000字节更长的跳转（在前后方向上都 
是如此）。对于确实长的程序会出现什么情况呢？ 

这在 jasmin 中用两种方式解决。首先，除了 goto 指令以外，还提供一个 goto _ w 指令（有 
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时称为“宽 goto ”， 实现成为操作代码 0 xC 8)。 它在多个方面都类似于常规的 goto , 但后跟一 
个更长的整数，使得程序员能前跳或后跳多达20亿字节左右。由于单独的 JVM 方法不允许大 
于 2 M (大约64 000) 字节长，如果你写了一个更长的方法，或许就要将其分成若干个部分, 
这个新的操作代码解决了这个问题。当遇到像 goto Somewhere 的语句时，决定用什么操作代 
码仍然是汇编器的工作，它可用 0 xA 7 或者 0 xC 8 指令。如果需要的偏移过大，不能装到短整数 
中，就自动将程序员的 goto 转换成机器内部的 gotoj ^。 

一个更严重的问题是不存在对应 1 fne _ w 的直接对等指令或者其他宽的条件转移指令。然 
而，汇编器仍能在无需程序员的知识或合作的情况下设计出等价功能。一个转移到遥远位 S 
的宽条件转移的功能可用一个“绕过转移的转移”的方法来模拟，如图 4-6 所示。 



• 舆正需要的是 - 1 fne OlstantLocation " 


«但由 T 1 太远，不能在单步达到 
. 不幸的是，不存在 
. 汇 编器会 实现这个功能 



Ifeq Skip , 

注意明试的是相反情况 


goto_w OlstantLocation ( 

因为我们在绕过转移 

Skip ： 

. 做 其他一 苎亊情 



图4_6 —个“绕过转移的转移”的例子，即有条件地跳转到遥远的位诧 

就像计算转移大小一样，一个好的汇编器对于这种情况总有正确的做法. 

使用转移语句的烺严重的问题是它们没有以任何方式为程序员提供局部模块结构。很多 
程序员依赖于能在模块内*新定义局部变妖的便利，如下 所示： 

if (x > 0) { 

int x ; //这蛙一个新的 x , 与以前的无关 

x - -1 ； 

• • • 

} 

// 这里，旧的 x 敢新出现并重新请求其旧值 

在汇编语言中没有这种便利性。所有的局部变 ft (以及堆栈）在跳转之前、期间、之后 
都保留其值。如果在跳转前，一个重要 的变最 存储在#2,而下一条语句是 fstore _2, 则该# 
要变董将被重写。模块结构对于如何考虑汇编语言程序是一个重要的便利，但它没有提供像 
信息隐藏等任何实际的防范措施以避免错误和误用。 

4.4 示例： Syracuse 数 
4.4.1 问题定义 

作为一个将这些内容结合到一起的例子，我们将探讨 Syracuse 数（即 3 W +1〉 猜想。这个 
问题可追溯到古典数学，一个古希腊人注意到一些简单的算术规则会产生惊人的、不可预测 
的行为，这些规 则是： 

•如果数^是1,则停止。 

•如果数^是奇数，则将/ V 变为 3 AT +1, 并继续。 

•如果数^是偶数，则将^变为 W 2, 并继续。 

人们在早期发现，若你从任何一个正整数开始进行，这个过程看起来总会停止（到达 1), 
但没有人能实际地证明这个猜想。进一步地说，没有人能发现一个一般的规则以预测需要多 
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少步才能到达1。有时这个过程恰巧非常快： 

16— 8— 4—2—1 

但相近的数字可能需要不同的 次数： 

15— 46—23—70—35 — 106— 53—160—80— 
40—20—10—5—16—8—4—2—1 

有时需要非常大的次数。甚至在目前，也没有人知道需要多少步，甚至是否总是到达1 
(虽然数学家采用计算机已经发现所有小于几十亿的数都会收敛到1)。你自己试着做一 下：从 
81开始，你认为需要多少步才能到达1? 

4.4.2 设计 

更好的办法是不用你自己去做，而是让计算机做这件事情。图 4-7 给出了针对开始于81直 
至到达1的算法的伪代码。用 Jasmin 实现这个算法就会快速得出这个猜想的答案。 


(1) count_of_steps <- 0 

(2) current_value <- 81 

(3) while (current_value !* 1) 

(4) if (current.value is odd) 

(5) current_value <- (current.value *3)+1 

(6) else 

(7) current.value <- (current.value / 2) 

(8) endif 

(9) count_of_steps <- count_of.steps ♦ 1 

( 10 ) endwhile 

( 11 ) final answer is count_of_steps 


W4-7 用伪代码测试 Syracuse 猜想 


图 4-7 中的代码需要两个整数变 ft , 为计算简单，我们将它们看作整数类型（而不娃长整 
数）。特别是， count _ of _ steps 可存储为局部变量# 1 ,而 current _ value 可被存储为局部变最 
#2。步骤1、2、5、7、9的算术运算可用第二章的技术来执行。第11行的输出可用若干种方式 
完成。这里我们选择较简单的一种，躭是只打印最终结果。 

从第 4 到第8行用到的 if/else 结构可用第 4.3.1 节的代码块来建模。特別地，我们可用除以2 
取余数 ( Irem ) 的方法来确定当前值是否是奇数。如果结果等于0 ( if _1 cmpeq >, 则该数是 
偶数。图 4-8 中的代码显示出这一点。作为典型的结构化程序设计，从整体上看，这个模块在 
起始语句有单个入口，在底部有单个出口（标记为 Exit : 的那一点>。 


. 1 f/else 的入口点 

I 装入 current_value 
2 . 还有2,以确定奇偶性 

irem ,计算余数 

iconst-0 , 比较 余数与 0 

-icmpgt CaseOdd , 如果是奇数，躭转到 CaseOdd 


CaseEven: 


从技术 t 说，我们不需要这个标号 
因为永远不会转移到这个位 S 


将 #2 除以 2 并轚 新存储 

. 装入当前值 
2 , 压入 2 用于除 

idiv ,做除法 

istore_2 ,并压人新值 


图 4-8 Syracuse 数计算代码内部模块的 if/else 结构 
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goto 

Exit i 跳过 CaseOdd 模块 

eOdd: 

. 将#2乘以3并加1 

iload_2 

• 装人当前值 

彳 const」 

* 压入 3 用于乘 

iraul 

»做乘法（现在存储的值就是 3*N> 

iconst^l 

• 压入1用干加 

ladd 

• 做加法（存储的值就是 3*N+1) 

istore_2 

. 并将新值存起来 


Exit: 

« W/else 分支的共同出口点 


图 4-8 (续） 

全部的代码块将用于 while-loop 结构的内部，如图 4-9 所示。 

• while 的人口 
LoopEntry: 

iload_2 ,从#2中装人 current_value 

iconst.l, 将 CU rrent_va〗ue 与 1 比较 

lf.icmpeq LoopExit ,如果 相等就转移到 LoopExIt 

. 做奇偶计算的必要语句 

• 递增 count_of_steps 的必要语句 

goto LoopEntry . 无条件转移到循坏的顶部 

• 并*新检测 

LoopExit: 

. 汕 ne 術环的出口点 


W4-9 Syracuse 数计算代码主循坏的 while 结构 


4.4.3 解答与实现 

这里给出了完整的解答。 


• 样板 

.method public <init>()V 
aload_0 

1nvokespecial java/1ang/Object/<init>()V 
return 
•end method 


.method public static main([Lj ava/1ang/St ring;)V 

• limit stack 2 , 这里没有复杂的计算 

• limit locals 3 , #0 是保留的（通常 情况） 

. #1是循环计数器 
. #2是 N 的值 



#1 <- 0 

,#2 <- 81 


补充资料 
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LoopEntry: 
iload_2 
iconst_l 
1 f_icmpeq 


LoopExit 


从 #2 装人 current_val ue 
将 current_value 与 1 比较 
如果相等，就转移到 LoopExit 


. 做一些奇偶计算所必要的语句 
1f/else 的人口点 


1 rem 
iconst_0 

if_icmpgt CaseOdd 


装人 current_value 
还有 2, 以确定奇偶性 

计算余数 
将余数与0比较 

如果是奇数.則转移到 CaseOdd 


只有#2是堝数时我们才能到这电 
将#2除以2并重新#储 



goto Exit 


CaseOdd: 


• 将 #2 乘以 3 再加 1 
iload_2 



Exit:. 执0递增 count, 
line 1 1 

goto LoopEntry 


装人当前值 
压入 2 用于除 
做除法 
存储新值 

跳过 CaseOdd 模块 


. 装入 今前值 
* 压入 3用于乘 

. 做乘法（埂在存储的值是3*>0 
. 压入 1用干加 

. 做加法（存钻的值是 3* N + 1> 

. 并存 储新悄 

. steps 的必要语句 
. 递增循坏索引 

. 无条件转移到顶部，并《新检测 


LoopExit: 

. 打印结采到 System.out (通常 如此） 

getstatlc j ava/1ang/System/out Lj ava/io/PrintSt ream 

iload 1 . 装入循坏计数器用于打印 

1 nvokevirtual java/io/PrintStream/println(I)V 


return 
end method 


完成 


4.5 表跳转 


多数高级语言还支持多路判定的槪念，这在 Java 中表示成一个 switch 语句。作为这种多 
路判定的使用示例，请看一个试图计算一个月中有多少天的程序，如图 4-10 所示。 

显然，任何多路转移都能以一组两路转移（如 if/else 语句）来看待，并据此编写程序。 
JVM 还提供了一个快捷方式（事实上是两个快捷方式），使得在某些条件下代码执行得更简单 
更快速。主要的条件 就是： 分支 （ case ) 标号（例如，就是在前面例子中的数字1到 12) 必须 
是整数。 

如前所述，没有直接的模块结构的槪念。机器提供的是一个多路转移，计算机根据堆栈 
顶部的值，转移到这若干个目的地之中的一个。 lookupswltch 指令的一般格式包含一组 的值： 
标号对。如果值匹配堆栈顶部元素，則控制就传递到该标号。 
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运行直至最终值（12, December ) 而没有中断或跳过，这样 A 话， JVM 就提供了另一个用于 
多路判定的快捷操作。该思想很简单，就是如果最低的可能值是36,则下一个值就是37,然 
后是38,依此类推。如果定义了最低值和最髙值，其余的值就可像表一样填充。因此，这个 
操作称为 tableswitch , 使用方法 如下： 


Days28: 


Days 30: 


Days31: 


iload -1 

tableswitch 
Days31 
Days28 
Days31 
Days30 
Days31 
Days30 
Days31 
Days31 
Days30 
DaysBl 
Days30 
Days31 
default 

blpush 28 


goto ExawpleEnd 

bipush 30 

istore _2 

goto ExampleEnd 

bipush 31 

istore 胃 2 

goto ExampleEnd 


假设、0的加0•存储在 #1 中 
开始多路转移，从1到12 


装人28天 
并分配到天 (#2) 

装入30天 
并分 fc 到天 （#2) 

装入31天 
并分 fc 到天（參2> 


. 错误发生时完成的动作，如 oetstatlc 
,并打印出一个锥误佶息 

goto ExampleEnd 
ExampleEnd: 

. 做必要 的事情 


../ System/out 


补充资料 

1 ookupswl tch/tableswl tch 的机器码 

lookupswltch 和 tableswitch 郝涉及可变数量的参数.因而在字节码中就有复杂的实 
现。实质上，存在一个关于有多少个参数的“隐藏的”隐含参数，使得计算机知道下一个 
参数从哪里开始。 

对于 lookupswltch 的情况， Jasmin 汇编器将为你统 计值： 标号对的数量。所生成的 

字节码不仅包含 lookupswitch 操作代码 （ OxAB ), 还有一个4字节用来对非 default 分支进 

行计数。每个分支存储成4字节整数（值），并且当该整数匹配堆栈顶部元素时就取得相应 

的4字节偏移。 ' 

对于 tableswitch 的情况，值可通过开始和最终值计算出来。一个 tableswitch 语句 ( 

在内部存储成操作代码字节 ( OxAA ). 低值和高值（存储成4字节整数），最后是一组连续 1 

的4字节偏移（对应于值 / ow 、/ cnv + 丨、 / oh +2, - high ) a 两个指令更详细介绍见附录 B 。 
_ _ _ _I 

在 tableswitch 例子中唯一不同的操作是 tableswitch 本身。其余的代码是相同的。重要 

的不同点与表的结构相关。程序员需要定义变量可取的最低值和最高值，然后对标号从小到 
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大排序，而不是明确地写出所有的 标号： 值对。这些都是由表舍构自动地完成的。在上面的 
例子中，第四个标号 （ Day 30) 是自动地附于第四个值的。如前所述， default 分支是必须要 
有的。 

当然，这些跳转表是否会对程序的效率有所帮助，要看具体情况和具体问题。一个 switch 
语句总是能写成一组适当的有合适复杂条件的 if 语句。在某些情况下，计算一个布尔条件比枚 
举各种情况可能要容易一些。 

4.6 子例程 


4.6.1 基本指令 

基于分支控制的一个主要局限性是在一个代码块被执行后，它将0动地将控制转移回到 
一个不可改变的点。与高级编程语言中的传统过程不同，要建立一个代码块使得从程序中任 
何一点运行然后再回到原来的地方，这是不可能的。（见图 4-11 >。为了做到这一点，需要更 
多的信息以及新的控制结构和操作。 



Parti ： 


PartIReturn ： 


• 做一些卓情 
• 做 -些事情 
goto UtilityProcedure 

. 利用返网值供:•盩事情 


做一些基本的实用工具子例程 


Part ?： 


Part2Return ： 


UtilityProcedure ： 


. 做一垮赛悄 

goto UtilityProcedure • 间一 个暮本 的实用 IjV 子例程 
. 并利用该返 回值做 一些不 M 丰 W 


• 从堆栈取值 

. 并抶行计算 

,子例程现在结束 

goto ?????? , 到哪里？ PartIReturn 还蛙 Part2Return? 

« 没柘办法做这个决策！ 



S4-11 子例程返回问题 


需要的主要信息当然是控制来自何处，因为该位 S 要作为返回点。这需要两个基本的修 
改： 首先，有一个也存储（到某处）跳转前 PC 值的转移指令，其次，有另一种会返回到一个 
可变位置的转移指令。采用这种语义写成的代码块通常叫做子例程 ( subroutine ), 

JVM 提供一个 jsr (跳转到子例程）指令。在技术上，为满足这个需要，它提供了两条指 
令， jsr 和 jsr _ w , 这类似于 goto 和 goto _ w 。 当 jsr 指令执行时，控制被立即传递（就像用 
goto 指令一样）到标号，标号的偏移存储在字节码中。在此发生之前，计算机计算出值 （PC 
+ 3)，这是紧接着 jsr 指令本身的下一条指令的地址。该值作为一个常规的32位 （4 字节）量 
被压入到堆栈，就在此时控制被传递到标号。 
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补充资料 


jsr 的机器语言 

为了确切地理解指令如何工作，让我们详细地考察 jsr 指令的机器码。 jsr 助记符对应 


于单字节 （ OxA 8 )。Jsr 后接一个 2 字节的偏移，存储成一个带符号的短整数。假设存储器 
位置 0x1000 —0x1003 存储了如表 4.3 的模式。 

表 4-3 jsr 指令的字节码结构 


位筲 

字节值 

解释 


0 x 1003 


jsr 


Integer ： 


当 Jsr 指令执行时， PC 将有值 0x1000 (根据定 义）。 存储器中的下一条指令 
(1 stored) 存储在位置 0x1003。 


所有提供子例程调用的机器也提供从子例程返回的指令。如何在基于堆栈的计算机上完 
成这一点是相当容易理解的。返回指令将会检杳堆栈顶部并使用存储在那里的值，这个值是 
由 jsr 指令压入作为返回的地址。这个位置就成为一个隐含分支的目标地址，控制返回到主程 
序，计算继续正常运行。 

在 JVM 上事情就稍微复杂一些，主要是安全性的原因。 ret 指令不检査堆栈以获得返回位 
展， 而是接受局 部变* 数作为一个 参数。 任何子例程必须执行的第一个任务就是将 Jsr 指令 
(隐含地）压入的值存储到一个适当的局部变 量中。 做完这件亊之后，就不再改变这个位 K 。 
试图对存储地址执行计算在 烺好的 情况下也是危险的，通常是会引起误导，而在 Java 和相关 
的语言中则是完全非法的。这也是安全性模型和验证器通常要避免的事情。 


4.6.2 子例程示例 

为什么要用子洌植 

子例程的一种常用用法与 Java 方法或(： ++ 过程很类 
似： 就是执行一个特定的固定任务，而这个任务在程序 
中的若干个位 S 都可能需要。一个明显的例子就是打印 
某些东西。正如我们在前面的一些例子中所看到的，诸 
如打印一个串等事情可能相当棘手，需要用几行来完成。 
为了使程序更容易和更髙效，一个熟练的程序员可将这 
些行做成一个子例程模块，并用 jsr 和 ret 访问。 

子例程 Max (int A int B ) 

让我们从一个算术运算子例程的简单例子开始。这 
个简单例子计算（并返回）两个整数之中的较大者 0 。让 
我们假设两个数（作为整数）在堆栈上，如图113所示。 



jsr 位置 



1 

1 R 


x + 3 


PC | 位 S | 


堆栈 



W 4-12 jsr 指令和堆栈 


9当 jsr 指令执行时，值 0 x 1003 (作为地址）被压人到堆栈， PC 的值改变为 Ox 1000+0 x 0010, 即0 x 1010。这 
意味音程序将向前跳转 16 个卞节 并开始 执行一 段新的代码。当 ret 指令执行时，将返回位 ^0 x 1003 的 
icor ) S t _0 指令。 Jsr _ w 指令类似，只不过它涉及4字节的偏移（因而可进行吏长的跳转），并将值 PC +5 压 
入。(见图 4-12) 
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参数 2(B> 

应该变成 

max(A. B) 

参数 1(A) 

- » 



图 4-13 max(A,B ) 的堆栈结构 


if _1 cmp ?? 指令将为我们做适当的比较，但会弹出（并销毁）这两个数。所以在做这件事 
之前，我们应该采用(1叩2复制堆栈顶部的两个字。在做之前，所有子例程必须处理返回地址。 
为简单起见，我们将其存储到局部变量#1。 


Max: 


, 假设这通过 jsr Max 来调用 
, 两个整数已经在堆栈 h 



, 将返回地址存储到 fl 


dup2 . 拷 W 两个畚数以各后用 

if.icmpgt Second ( 如果 a<B, 則转移 
First: 

.A >= B, 所 以需要 从堆栈中劂除 B 
pop 

goto Exit 
Second: 

,A < B, 所以黹要将 A 交换到 m 部并 劂除它 

swap 

pop 

Exit: 



返回到存储汴 #1 的位 K 


子例枉 PrintString(String s) 

作为第二个例子，我们将写（并 使用） 一个子例程，功能是输出一个固定的串，该串被 
压在堆栈上。让我们首先写出子例程： 


假设这通过 jsr PrlntDream 调用 
娄打印的中已经被压人到堆栈 
位 T 返问地址 K 面 



将返问 地址存储到 #1 


,假设要打印的串已经在堆栈上 
. 你应该已经 r 解 Klli 三行 

getstatic j ava/1ang/System/out Ljava/io/PrintStream 
swap , 将参数按正确的顺序放置 

invokevlrtual java/io/PrintStream/println(Ljava/1ang/Stnng;)V 
ret 1 • 返回到存储在 #1 中的位 S 

新的指令 astroe _ l 是? store - N 的又一个例子，但它存储的是一个地址（类型 ‘ a ’） 而不 
是一个浮点数、双精度数、整数或者长整数。 getstatic 和 invokevirtual 这两行你应该已经 
熟悉了。该代码假定调用环境在执行跳转到子例程的调用之前已将串压入，这样你只需要压 
入 S ys tem. 0 ut 对象和调用必要的方法。一旦做完， ret 指令就使用新近存储到#1的值作为返回地 
址。然而，要注意仍需要做点“信息隐藏”或模块结构的工作，因为这个子例程会不可挽回 
地摧毁已存储在局部变 ft # l 中的任何信息。如果程序员想要采用这个代码模块，他就需要注 
意这个行为。更一般地，对干任何子例程，重要的是要知道哪些局部变量是子例程用到的和 
不用的，因为它们与主程序所使用的是同一组局部变量。 


使用子例程 

主程序可写得任意复杂，并可能涉及对该子例程的多次调用。打印几句诗怎么样? 

. 压 入要打印的第 一个串/行 

ldc ’ "Twas brillig, and the siithy toves" 

I 阐用在 PrintStnng 开始的子例程 
jsr Printstring i 这行以后 4 上返回 

. 注意不需要标号 

. 以类似的方式继续 

Idc "Did gyre and girable in the wabe.". 



ldc "All mimsy were the borogroves" 
jsr Printstring 

Idc "And the none raths outgrabe." 
jsr Printstring 

» 永远不耍忘记引用诗的出处 

Idc "(from Jabberwocky, by Lewis Carroll)" 

return , 退出方法，因为我 们已经 打印了 这铨诗 

这个程序的一个完成版本在图 4 -14 中给出。（实际上，在图中有一个故意的错误。有一行 
不会打印出来。你能发现是哪^行和为什么吗？更東要的是，你知道如何改正这个错误吗？） 



图 4M4 子例程示例的完整程序（包含一个错误 ) 
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return 


i . 退出方法，因为我们已经打印了这首诗 

假设这个 f • 例程通过 Jsr PiMntStrlng 调用 
要打印的串已经压入到堆栈 
( 在返问地址的 F 面） 


astore.l , 将返回地址存储到 》1 
. 假设要打印的中 己经在 堆栈上 
. 你应该已经 了解下 面三行 

getstatlc Java/1ang/System/out Ljava/lo/PrlntStream; 
swap , 将 参数按 正确的 _ 序放 》 





4.7.1 问题定义 

现在每个人都知道 ji 的值 （3. 14159以及更多 
几位）。数学家是如何计算出它的值的呢？在几 
个世纪中已经试验了很多方法，包括一种不是因 
其数学上的复杂性而是因为其简单性而闻名的。 
我们在这里给出这种方法的一个变型，该方法首 
先由 George de Buffon 使用。 

考虑（随机地和均勻地）向图 4-15 所显示的图 
形中掷飞镖。我们假设飞镖可能击中正方形区域内 
的任何地方。特别是，一些飞镖会击中圆内而另一 
些没有击中圆内。由于正方形的边长是两个单位， 
故其总面积是4。圆的面积是计算得出面 积为: X 。 
这样，我们预计飞镖击中圆内的比率将会是：1/4。 



图 4-15 蒙特卡洛 ji 估计的图示 



-控制结构 


换句话说，如果我们向图中投掷10000个飞镖，我们预计会有大约7854个会击中圆内部。 
我们甚至可将注意力关注在右上象限，并得出同样的结果。 

这种探讨方法通常称为蒙特卡洛模拟 (Monte Carlo simulation). 当你对槪率空间的精确 
参数不确信时，这可成为探索大槪率空间的非常有力的方法。它也属于那种计算机能显示其 
优越性的任务，因为简单的计算（飞镖击中哪里？击中的是圆内还是圆外）可被重复成千上 
百万次直到你得到一个足够精确的解。 


4.7.2 设计 

3.4.1 节讨论了随机数生成的一点理论和实际知识。在那一节中开发的代码可为我们提供 
随机的整数，但这里要做一些变化。主要的变化是（在单位圆中的）每个位 S 由两个数来定 
义，因此就需要在两个不同的地方调用生成器。这就意味着要使用子例程。 

除此以外，该程序需要两个计数器，一个用干投掷的飞镖数，一个用于击中圆内的飞镖 
数。对于任意一个飞镲，如果其击中的 位置是 U ,： y )， 则其击中圆内当且仅当 / + 

解决这个问题的伪代码大致如图 4-16 所示。问题本身的结构因涉及重复的随机点生成以 
及统计成功和失畋次数，所以也表现出某种循环的特质。关系到成功和失败（在单位圆的内 
部或外部）的实际决策将用一个 if/then 等价结构来实现。总之，这个程序可采用同样适用于其 
他编程语言（像 Java 或 Pascal) 的高级结构来着手设计。 



1 up to 10000 ) 
generate (x,y) position for new dart 
if ( (x.y) inside circle ) 

total.hits <- total .hits •♦- 1 

endif 

endfor 

final answer is (total.hits / 10000 ) 

FINAL final answer is (total.hits / 10000 ) ， 



W4-16 用*特卡洛方法计的伪代码 


在这个模块执行足够时间后，成功次数与总执行次数的比率应该接近冗/4。 

对于变量，我们将需要至少两个整数用作计数器，另一个位: S 用来保存随机数种子的当 
前值，还有两个位 S 用来保存当前飞镙的 U ,： V ) 坐标，还有第6个变量用来保存从随机数生 
成子例程返回的位置。必要的控制结构已经都在前面部分讨论过了。 

特別是，如果变量#4和#5分别保存（作为浮点数）了: r 和 y 坐标，则只要飞镖在圆内，下 
面的代码模块就会递增在#1中的计数器。 


fload_4 

dup 

fmul 



dup 

fmul 

fadd 

fconst_l 
fcmpg 
ifgt Skip 
iinc 1 1 

Skip ：, 做需要的亊情 


» 从 #4 装人 x 坐标 
,对其 做平方 
, 从》 5 装人 y 坐祕 
. 对其做平方 

. 计算 x A 2 + y A 2 
, 压入 1 用 子比较 
. 做比较 

• 如果在鼴外 , 則转到 Skip 
,递增在幻中的计数器 


㊀ 如果你不确信这个公式为什么可行，可以使用距离公式。 
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我们可以修改3. 4 .2 节的第一个随机数生成器，就能相当容易地生成浮点数，见下面的代 
码片断： 


I 计算 a*oldvalue 
ldc2_w 65537 



121 

lmul 


• a 是 2M6+1 ， 存储为长整数 
. oldvalue 被存储为局部变 fi#3 
« 将 oldvalue 转换成为长整数 
,并做乘法 



ladd 

, 获得 mod ni 的余数 


.c 趁 5 ,存站为一个长整数 
I 并加到 a^oldvalue 


ldc2_w 4294967291 
lrem 
121 
dup 



. 为 m 装入值 
. 计算模 
■ 转换回螯数 
. 复制，为/ •存储 
. 为下次存储新值 


i2f . 转換成浮点数 

ldc 4294967291.0 , 作为浮点数装入 m 

fdiv , 做除法，得到 [0,1 ) 中的数 

.fF •点数留在堆栈顶部 


这个片断又会成为生成^和>^坐标的子例程的核心。 

4.7.3 解答与实现 

这里给出了完整的解答。 


通过蒙特卡洛楱拟计 W.P1 的程汴 


.class public pi 
• super java/lang/Object 


, 样板 

.method public <init>()V 
aload.O 

invokeBpecial j ava/lang/Object/<init>0 V 
return 
.end method 


.method public static main( [Ljava/lang/String;)V 


.limit stack 4 
.limit locals 7 


iconst_0 

istore,l 

. 迄今投掷的飞镍数是 o 
. 飞镣数在 #1 中 

iconst^O 

i8tore«2 

. 迄今投拇到内部的飞镖数是 0 
, 投掷到内部的飞镖数在 #2 中 

iconst__l 

istore.3 

, 将随机数生成器的种 + 设为 1 
, 随机数生成器神了 - 在 #3 中 

iload_l 
ldc 10000 
if.icmpgt End 

,装人投掷飞锶的数 ft 
. 与 10000 飞镲比较 
. 如果多于 10000 ,退出循环 




fconst.l 

« 压入 1 用于比较 

fcmpg 

. 做比较 

ifgt Skip 

. 如果在脚外，則转到 Skip 

line 2 1 

| 递增在中的圆内飞镲数 

Skip: 


line 1 1 

« 递增在 #1 中的投梅总 飞铤数 

goto Head 

. 并转到循环的顶部 

Random : 


astore 6 

* 存储返回值 

i 计算 a»oldvalue 


ldc2_w 6B537 

» a 是 2M6M . 存储为长整数 

iload_3 

• oldvalue 存鲭为鉍部变量 #3 

121 

. 将 oldvalue 转换为长整数 

lmul 

. 并做乘法 

« add c 


ldc2_w 5 

.c 为 5 ,存储为 长螫数 

ladd 

1 并加到 a*oldvalue 

• 并获得 mod m 的余数 


ldc2.w 2147483647 , 为■装入值 

lrem 

. 计算模 

12i 

. 转换回整数 

dup 

. 复制，为了存 tt 

istore_3 

. 为下次存储新值 

i2f 

. 转换成浮点数 

ldc 2147483647.0 

作为浮点数装人 m 

fdiv 

. 败除法，得到 [0, 丨>中的数 

ret 6 

. 返回到存储于的 中的调 用环塊 

End: 


iload-2 

. 装人内部的总飞镲数 

i2f 

* 计算浮点数比串 

iload.l 

»装人总飞揉数 

i2f 

»计算浮点数比串 

fdiv 

« 做除法 • 计算比率 （ P1/4) 

ldc 4.0 

, 乘以 4 

fmul 

,得到最终的解 

. 并打印 




82 第一部分假想计算机 


getstatic java/lang/System/out Ljava/io/PrintStream; 
swap , 使参数傾序正确 1 

invokevirtual java/io/PrintStream/printIn(F)V 



•end method 


4.8 本章回顾 


•当前正在执行的指令的位置存储在 CPU 内部的程序计数器 （ PC ) 中。在正常情况下， 
每次一条指令被执行， PC 就递增以指向紧接着的指令。 

•某些指令可改变 PC 的内容，因而导致计算机改变其执行路径。这些语句通常称为转移 
语句或 goto 语句。 

•任何语句若是转移的目标则必须有一个标号 （ label )。 标号只是一个字，通常开始于一 
个大写字母，标记其在代码中的位3。 

• goto 语句执行的是无条件转移。控制直接转移到其参数标记的点。 

• If ?? 系列的条件转移将控制转移到目标位置（也可能不转 移）。 这些指令从堆栈弹出一 
个整数，并根据该整数的大小和正负来决定是转移还是继续正常的取指-执行周期。 

• ? cmp 系列的语句用于对非整数类型做比较。这些指令从堆栈弹出两个适当类型的数， 
并根据第一个参数是否大于、等于或小于第二个参数而压入值为1、0或 - 】的整数。这 
个整数接着就可用于后续的 If ?? 指令。 

• ifjcmp ?? 指令将 Icmpig 句的功能与 If ?? 条件转移系列相结合成为一条指令。 

• 事实上，像 if / else 语句和 while 循环这样的商阶控制结构必须在汇编语言级別用条件和无 
条件转移来实现。 

• lookupswltch 和 tableswltch 语句提供一种执行多路转移语句的方法，对于实现 case 或 
switch 语句来说，这可能比一系列的 if / else 语句吏髙效。 

• 子例程的工作原理是将 PC 的当前值压到堆栈，并在子例程结束时返回到先前存储的位 
置。在 Jasmin 中，这分别对应于 jsr 和 ret 指令。与多数其他机器不同，为安全原因， 
ret 指令期望在局部变 ft 中寻找返回地址。因此，子例程中的第一个操作通常是 astore 
操作，用以将（压入的）返回位 K 从堆栈存储到局部变 ft 。 

4.9 习题 

1. 为什么 JVM 不允许直接将一个整数装入到 PC ? 

2. 结构化编程的槪念如何在汇编语言中实现？ 

3. “如果大于0或小于0则转移”指令在】 VM 指令集可得到吗？如果没有，你如何实现它？ 

4. NaN (不是一 个数） 大于或小于0吗？ 

5. 你如何在 jasmin 中建立一个 if / dse - if / dse - if / else 控制结构？ 

6. goto 和 goto _ w 之间有什么差別？有相应的 ifmw 指令吗？ 

7. 在图 4-8 中的代码使用 irem 来确定一个数的奇 偶性。 Juola 的 “multiple cat skinning " 定律指 
出做任何亊情总有更多的方法。你能找出一种方法，用 land 来确定一个数的奇偶性吗？用 
lor 怎么做？ 

8. 用移位操作怎么做呢？ 

9. 图 4-14 中的错误是什么？解决方案是什么？ 

10. (本题针对髙级程序员）本章中提出的 jsr 和 ret 的语义支持递归吗？并给予解释。 



4.10 编程习题 


第4聿 控制结构 83 


1. 写一个程序，确定小于或等于 W 的2的最大幂。 

2. 至少有两个不同的方法能针对前面的问题编写程序，一个使用移位指令，一个使用乘法/除 
法指令。在你的机器上哪个运行得更快？ 

3. 写一个程序，确定能装入一个整数变量的 W 的最大幂。再确定能装入一个长整数局 部变* 的 
^的最大幂。你如何判定什么时候发生溢出？ 

4. 写一个程序，使用密钥 13*17 和 e = 11实现 RSA 加密和解密（你可能要在 Web 上査找这个 
算法）。 

5. a . 写一个程序，测试随机数生成器的优劣。特别地，该程序应该以大致相间的频率产生所有 

输出。随机生成从1到〗0的100 000个数。最小频率的数应该至少在最高频率的数的90%频 
率内。你的生成器优劣如何？ 

b . 寻找产生一个好的生成器的 fl 、 c 、 m 的值。 

c . 寻找产生一个坏的生成器的 A q m 的值。 

d . (本题针对髙级程序员）对生成器的输出运行 chi - 平方测试以确定其优劣程度。 
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第5章通用体系结构问题：实际计算机 


5.1 虚拟机的限制 

JVM 作为虚拟机已经在大多数真实计算机上得以实现。在某种意义上， JVM 设计者已经 
取得了很大的成功一因为 JVM 是非常简单并且易于理解的体系结构，也是计算机组织与体 
系结构教学的最佳用机 之一。 然而，这种简明在某种程度上忽略了实际计算机器件的某些限 
制。例如， JVM 中的每个方法 （ method ) 假定运行在其自包含的环境中；改变一个方法中的 
局部变鼉不会影响其他的方法 • 相比之下，只有一个 CPU 和一个主存储器的实际计算机意味 
着同时运行两个功能会引起对寄存器、存储器等的争用。你可以想象，如果一个支票填写程 
序开始接收数据（比如从一个游戏），同时开始打印支付星云学会剩余光子鱼宙的支票将会导 
致的混乱。 

类似地，机器容董问题对于 JVM 或者类似的虚拟机来说却不是问題 I 对于所有实际用途， 
JVM 虚拟机的栈具有无限的深度，能够容纳无限置的局部变 通：。 对比之下 ， PowerPC (用于 
游戏机的芯片，近来也用于 Macintosh ) 只有32个寄存器用于计算，而基于 Pentium 的 Windows 
PC 用于计算的寄存器就更少了 • 

JVM 能够忽略的另外一个主要问题便是 速度。 要快速地执行一个 】 VM 程序，你仅需要在 
一个快速的物理处理器上运行一个 JVM 的 拷贝。 相比来说，要建造一个快速的物理处理器， 
就需要解决具有难度和竞争性的工程 问题。 Intel 和 AMD 的工程师一直在进行前沿探索，以便 
制造更快速的处理器。当然，世界上那些训练有素的工程师们正在逐步解决这一难题，虽然 
如何解决这些问题的细节已经超出了本书的范围，但是接下来的各节将会探讨一些提商性能 
的部件优化方法。 

5.2 CPU 优化 

5.2.1 建造一个更好的捕鼠夹 

改善计算机性能的最明显方式就是提高整体性能参数一例如，将计算机的字长从 16 位 
增加到32位。两个32位数的加法在一个32位的计算机上只需要一个加操作就可以完成，但是 
在一个16位的计算机上却要通过至少两次相加才能完成。类似地，将时钟速度从 500 MHz 增加 
到 1 GHz 能将每个操作减少到原来的一半时间，相当于机器的性能增加了一倍。 

实际上，很少能像人们认为的那样有效。目前几乎所有的机器都是32位，32位寄存器对 
于大部分应用已经足够精确了。采用6 4 位的寄存器能使程序员设计支持⑴ 24 数量级的快速数据 
操作，但是多久你需要用到一次这种数量级的操作呢？除此之外，如果存储器和总线的速度 
都没有 CPU 的速度快，即使 CPU 很快也不一定能带来多大的益处。 
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更为严峻的是，以这种提髙速度的方式提髙性能是昂贵的、困难的。例如，处理器算术 
运算器件的速度受限于晶体管的物理和电气响应特征，运行太快容易使其毁坏。即使能够制 
造速度很快的晶体管，成本恐怕也是超级髙。建造64位计算机就属于这种情形，不但需要昂 
贵的晶体管，还同时需要两倍数量的晶体管。因此，工程师们一直探索在一般的技术架构下 
改善计算机的性能。 

5.2.2 多处理 

让计算机更加有效的一种方式是在同一时间执行多个程序。你可能正在写作业，然后停 
下来去加载一个网页，并且冏时査看计算机正在自动接收的你室友发来的邮件，与此同时还 
有人正在下栽你的个人主页看你近来的照片。只有一个 CPU (因此只有一个指令寄存器），计 
算机如何应付这些工作？ 

除了再买一个电脑——这是可行的，但是这样很昂贵并且对技术要求很高-种通常 

的选择是分时 ( time - sharing ) 0 如同分时使用假日公寓一样，将时间分为时间片（假日公寓以 
星期为时间片， CPU 以毫秒或微秒为时间片），允许使用设备的某个时间片。当这个时间片用 
完时，其他人轮换进来度假一周或使用 CPU 。 为了以这种分时方式工作，计算机必须能将程 
序停止在任意处，将与程序有关的信息（栈的状态，局部变量，当前 PC 等）拷贝到主存中， 
并且从不同的存储区域加载其他程序的有关信息。只要时间片和存储区域是各自独立的（我 
们稍候将会看到如何实现这两 点）， 计算机就好像在同时运行若干不同的程序。 

出于安全的考虑，每个程序必须能够独立地运行，每个程序都应防止影响其他的程序。 
另一方面，计算机需要有一种系统化的方式能够适时地将用户程序换入换出 CPU 。 这不是犇 
每个用户程序的良好表现，而是要借助操作系统进行管理。操作系统本身也是一个程序，但 
是操作系统的主要工作是控制其他的程序，并且实施安全规則。操作系统（简称 OS , 如 
MacOS , OS X ,乃至 MS - DOS ) 被授予普通用户级程序所没有的特权，包括中断现行程序的 
能力、向与程序使用无关的存储区域写入数据的能力等——这些权力常被形式化为编程模型， 
并且定义了超级用户与普通用户权限的差别。 

5.2.3 指令集优化 

加速计算机的一种方法就是使每条指令执行得吏快些。例如，经常出现的指令应该在硬 
件上做些调整，使其比其他的指令执行得更快些。这种优化技术已经用在了 JVM 上，例如 
iloadj ) 指令。 lloadj ) 指令比与其等价的 lload 0指令长度短 （ 1 个字节）并且速度快。（当 
然，几乎每个方法都会使用局部变量利)，但是很少会用到比如说局 部变優 #245。）取决于要运 
行的程序，有些指令经常使用，设计者应该对其进行优化。 

例如，在上面描述的多道程序系统中，“将所有的局部变歎保存到主存”应该是一个常见 
的行为。一个更易理解的常见并且高需求应用的例子就是图形比重髙的电脑游戏。良好的图 
形性能反过来需要快速将数据（位图）从主存移到图形显示设备。每次向 CPU 装载一个字的 
数据然后再将其存入显卡，不如用伪指令将一大块数据直接从存储器移至显卡。这种存储器 
直接访问 （ DMA ) 是很多现代计算机都支持的基本指令类型。类似地，对整个存储块执行算 
术操作（例如，用一个操作将全屏变为橙色）是 imel 后期部分芯片基本指令集具备的能力。 

“对不同的数据独立执行同种操作”是对处理能力的根本性增强。借助于并行操作（这种并行 
操作称为 SIMD 并行，即单指令多 数据） 可以极大地提高程序的有效速度。 

5.2.4 流水化 

使 CPU 工作得更快的另外一种方式是在给定的微秒时间内打包处理多条指令。正如字面 
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表述的意义，一种可能就是在一个时间内处理多条指令。为了实现这一点， CPU 需要有一个 
复杂、流水化的取指-执行周期允许其同时处理多条不同的指令。 

等一下！这怎么可能？窍门在于多个操作依次进行，但是每个操作分为多个阶段，而且 
各个阶段以流水化的方式处理。举一个实例，一排人站成一个传水的队列，我不是将水从井 
口拎到40英尺远的炉灶旁（可能需要1分钟），而是将水桶从与我邻近的人手中接过来，然后 
传给离我4英尺远的下一个人。尽管水桶离炉灶还有36英尺远，但是我的手已经空闲下来了， 
可以接送下一桶水了。每桶水从井口传到炉灶仍需要1分钟的时间，但是可以有10桶水在被同 
时传递，因此单位时间里就有10倍数董的水被送到炉灶旁。另外一个好案例就是汽车生产线， 
每个工人不是一次组装全车，而是只负责单一的任务环节，汽车的组装由多个小环节构成。 
更普通的一个例子，如果我有很多的衣服要洗，我将一部分衣服放入洗衣机，当这些衣物洗 
完时，我又将其放入了干燥机，然后我又将另外一部分衣服放入洗衣机，这时两个机器会同 
时运行。 

现代高端 CPU 都进行这种任务分解。例如，当 CPU 的一部分正在执行一条指令时 ， CPU 
的另外部分已经正在取其他的指令了。当这条指令执行完成时，下一条指令已准备就绪等待 
执行。这种流程也称为指令预取 (instruction prefetch ) ,在 CPU 真正需要这条指令之前，它 
就被取出了，因此这条指令立即可用。本质上， CPU 同时服务于两条指令，因此可以在给定 
的时间内处理两倍的指令，如图 5-1 和图 5-2 所示。这并不能改善延迟 （ latency ) ——每个操作 
从开始到结束仍然需要同样的时间一但是可以显著地提髙 吞吐串 ( throughput ), 即 CPU 每 
秒能够处理的指令总数。 
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图 5-2 流水化 洗衣： 6个小时内洗四次 

流水线的阶段数通常是不相同的，取决于具体的计算机，通常新的、速度快的计算机流 
水线的段数要多一些。例如，典型的中等级别的 PowerPC (如 603 e 型）采用一个4段流水线， 
可以同时处理最多4条指令。第一个阶段 是取指 阶段，将指令从主存栽入 CPU , 作为下一条要 
被处理的指令。一条指令一旦被取出，分派阶段就对其进行分析确定该指令的种类，并且从 
相应的位置获取源操作数，然后准备由流水线的第三个阶段（执行阶段）执行。最后完成/写 
回阶段将计算结果送到相应的寄存器，并且根据需要更新整个机器的状态（图5-3)。 

为了使流水化的过程尽可能有效，流水线应该一直都充满指令，并且数据一定要平稳地 
流动。首先，流水线只能以其最慢流水段的速度运行。简单的事情，如取某一条指令，能够 
和机器访存一样快地完成，但是指令的执行，特别是复杂的指令，就需要更多的时间。当其 
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中某条指令执行时，可能会在流水线中导致障碍（有时称为“气泡”），致使其他的指令堆积 
在其后，如同很多小轿车跟在一个慢吞吞的公交车后。理想的情况是每个流水段应该占用同 
样的时间，流水线的设计者应该确保做到这一点。 
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图 5-3 类 PowerPC 的流水线 


其他中断流水的方式就是从错误的存储器位置加载了错误的数据。这一考虑的最坏违反 
情况就是条件转移，例如 “jump if less than ” （如果小于就跳转）。一旦遇到了这条指令，下 
一条指令要么来 S 于指令序列的顺序下一条，要么来自于转移目标处的指令——我们可能不 
知道是哪一条。事实上，我们没有办法知道是哪一条，因为条件依赖于流水线的计算结果， 
当前尚无法得到该结果。无条件转移的情况还不太坏，只要计算机有办法足够快地辨识它 
(通常在流水线的第一阶段 进行）就行。 子程序返回也带来其特有的问题，因为返回 B 标保存 
在寄存器中，可能已经不可用了。最坏的情况是，计算机別无选择，只能停下来等待流水线 
排空（这会严衆影响性能，因为转移指令很常 见）。 考虑到这一缘由，很多研究开始关注预测 
转移目标的能力，以便继续保持流水线的填充。转移预测 (branch prediction ) 是计算机猜测 
是否执行给定分支（以及转移目标）的艺术。基于这一猜测，计算机将继续执行指令，产生 
的结果也可能是无效的。这些结果通常保存在流水线的特殊位®,如果猾测被确认是正确的 
才将其拷贝到相应的寄存器中。如果猜测是错误的，这些位《将被清空，计算机在一个空的 
流水线上®新开始。可以想象，炝坏的情况就是流水停顿，如果计箅机猜测正确，还可以节 
省一些时间。 

即使较差的算法也应该有50%的猜测是正确的，因为转移要么成功要么不成功。检査整 
个程序作出更准确的猜测通常是可能的。例如，对应 for 循环的机器代码通常包括一个代码块 
和一个位于循环结尾处的（向 后） 转移。既然大多数此类循环都执行不止一次（通常成 s ■上 
千次），就要有很多次转移成功和一次转移不成功。这种情况下猜测转移成功可以达到99.9% 
的准确率。更加精确的分析是否看每个转移指令的历史。如果一个转移指令已经执行了两次， 
而且两次都没有转移成功，那就可以推测 它这一 次也不会转移成功。 借 助大鼉的多种可用信 
息，工 程师们已经可以让现代处理器的流水化设计非常准确地（90%以上）猜测转移了。 

5.2.5 超 标置体 系结构 

涉及多条不同指令的其他技术还有重复设置流水阶段甚至是整条流水线。流水化的难点 
之一是保持各个流水阶段的均衡《如果某条指令的执行比其取指时间要长得多，那么就应该 
对流水阶段进行备份。超标量处理的思想就是在同一个周期立即执行多条不同的指令。为了 
充分理解这一点，需要将取指-执行周期一体化，并且假设并非每次只取一条指令，而是我们 
有一个等待处理的指令长队。（显然，这就是经常所说的指令队列一并没有假想的成份。） 
典型的 CPU 会采取模块复制来解决耗时的操作。一个类似的例子是给一个繁忙的髙速公路增 
加一个车道，以便缓解增加的交通流董。类似地，想一下一般银行的处理方式，每个出纳员 
都可以为下一个客户服务。如果一个客户的问题比较复杂，需要花很多时间处理，其他出纳 
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员就可以缓解这种停滞。与先前描述的 SIMD 并行不同，这是一种 MIMD (多指令，多数据） 
并行。当一条流水线正在处理某条指令（可能是浮点乘法）时，另外一条流水线可能正在进 
行另一个完全不同的操作（可能是加载一个寄存器）。 


补充资料 

Connection Machine 

如果你想了解一个真正的并行操作，看一下 Thinking Machines 公司在20世纪80年代 
末期制造的 Connection Machine 体系结构。 CM -1 (不久又有了更快的版本 CM -2) 型机包 
含了多达65536个不同的单元，每个都是一个独立的 lbit 处理器。所有的单元都与被称为 
“微控制器"的中央部件连接.这个微控制器向每个处理器发出相同的••纳指令” 
( nanoinstruction ) 0 CM -5 型机只能控制 1638 4 个不同的处理器，但是每个处理器都是一个 
功能强大的 Sun 工作站。这些处理器独立 运行， 但是也可以快速、灵活地将其互联，用来 
完成高速的并行计算。 

最初的 CM -1 釆用一种定制单元体系 结构. 毎个芯片上有16个单元。这些芯片又被连 
接在一起形成一个12路的超立方体 (12 -way hypercube ) 用来构建一个非常密集的网络， 
并且所有的单元彼此可以快速地 通信。 理念上 ， Connecion Machines 要尝试挖掘大规模并 
行的可能性，如人脑一样，并且超越传统冯•诺依曼体系结构的某些限制。一个神经元不 
具备强大的计算能力，但是正常人脑中 10 U 个神经元可以完成惊人的工作。以实用的术语 
描述， CM -1 可以被看成是 64 K 路 SIMD 并行。 遗钵的是，专用芯片的成本太高，因此 CM - 
5转向较少数董的商用 SPARC 芯片.并由此放弃了 SIMD 处理（像人脑一样） 而 青睐于 
MIMD 。 目前 CM -5 的后继机型在例如 Beowulf 机群并行处理中非常活跃。 


5.3 存储器优化 


为了使计算机尽可能快速、平稳地运行需要确保两件事 W 。 首先，计算机所需的数据要 
尽快地可用，以使计算机不必耗时去等待。另外，存储器应该防止被意外地重写，比如用户 
邮件代理不能从 Web 浏览器上误读数据并将你所看到的该页内容发给其他的人。 


5.3.1 cache 存储器 

对于32位字长的计算机，每个寄存器都能表示2 32 (约40 亿） 个模式。理论上，这允许处 
理器使用 4 GB 的存储器。而实际上，计算机所安装的存储器容景通常要小得多，对于某个程 
序来说实际使用的存储器容置就更小了。 最重要 的是，程序通常在某个时刻只使用整个程序 
中的很小一部分（比如， Web 浏览器中下载网页的代码只有在你真正点击按钮时才会使用>。 

存储器有多种不同的访问速度》也就是说，不同的存储芯片检索1比特信息所需要的时间 
是不同的。由于速度的关系，最快的存储器芯片的成本也最高。大部分程序在某一时刻只需 
要较小的存储容#：，因此大多数实际的计算机采用多级存储结构。尽管 CPU 芯片本身可以达 
到2或 3 GHz 的运行速度（即 0.3~0.5 n S 内执行一条指 令）， 但是大部分存储器芯片都非常的慢， 
有时存储器的响应时间是 50~100 ns 。 这看起来也许已经很快了，但是比起 CPU 芯片慢了将近 
400倍。为了减少存储器访问瓶颈，计算机也采用少量非常髙速的存储器，但是容量要小得多 
(通常最多几兆字节），称为 cache 存储器。（读作 “ CASH ” 存储器，源自法语动词 cacher ， 意 
思是“隐藏”。）它的基本思想是近期经常使用的存储区域被复制到 cache 存储器中以便 CPU 需 
要其中的数据时能够尽快地得到。 cache 存储器的设计和使用是一个艰巨的任务， CPU 自身处 
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理这其中的细节，程序员不必为此担心。大多数计算机支持两级 cache: —级 （LI) cache 位 
于 CPU 片内并且以 CPU 的速度运行 • 而二级 ( L 2) cache 是一组特殊的高速存储芯片，靠近 
CPU 位于主板上。正如你所期望的， LI cache 速度较快并且昂贵，这意味着 LI cache 容量最小， 
但是能够带来最大的性能提升。 

5.3.2 存储管理 

拥有32位字长的计算机能够向2 32 个不同的存储单元写入。（当然，64位的计算机有 2M 个不 
同的地址。）这些地址定义了程序可用的逻辑存储空间。当然，任何计算机可用的物理空间取 
决于所安装的芯片存储容量，也部分地取决于计算机的拥有者能够或®意花多少钱购置存储 
容量。程序不指向某一物理存储位置，而是指向某一逻辑地址，然后由存储管理将其转换为 
某一物理存储器位罝，甚至可能是硬盘的某一位置。 

存储管理通常被认为是操作系统的功能，但是考虑到速度、便捷以及安全的因素，很多 
计算机对此提供了硬件上的支持。尽管考虑到安全问题使得用户级程序不能访问这部分硬件。 
这就意味宥存储系统的大多数有趣的部分对于用户来说是看不到的，而只有管理模式下执行 
的程序才能感受到。用户所关心的存储器只是一个逻辑存储空间的一维数组，其中的每个元 
索都可以独立访问。因为这很重要，所以有必要再次强调：即使真实的物理存储器比逻辑地 
址空间相当大或者相当小，用户级程序都能够视逻辑地址如同物理地址，并且用适当长度的 
位模式表示物理存储器的某个存储位贾。 

在存储管理之下，需要进行逻辑存储地址到物理地址的转换。地址转换使得计算机能够 
访问直接与物理存储器对应的存储位置。这个过程利用了地址替代将一个地址空间（逻辑存 
储器） 转换为另一个地址空间（物理存储器）。这种存储过程以及存储地址空间通常被称为虚 
拟存储。为了简明地解释这个问题，我们将以32位的 PowerPC 为例对有些抽象的存储猗理加 
以介绍。有多种不同的方法完成这一转换，下面详细说明。 

5.3.3 直接地址转换 

烺简单的确定物理地址的方法就是直接地址转换，当硬件地址转换已经被关闭时采用此 
方法（显然，只有管理程序能够将硬件地址转换关闭）。在这种情况下，物理地址的每一位都 
与逻辑地址相同，并且只能访问到 4GB 的存储空间。如果两个进程试图访问同一个逻辑地址， 
没有简易的方法来阻止。直接地址转换通常用于关心速度的专用计算机，每次只运行一个程 
序：除此之外，大多数操作系统实施了另外某种地址转换。 

5.3.4 页式地址转换 

为了防止两个进程访问同一个物理地址（如果允许地址转换时）， CPU 的存储管理系统实 
际上将逻辑地址空间扩展到第三个空间，称为虚拟地址空间。例如，我们可以定义一组24位 
的段寄存器来扩大地址值。在这种情况下，逻辑地址的高4位定义并选择一个具体的段寄存器。 
这个段寄存器里保存的数值定义了一个具体的24位虚拟段标识符 VSID (Virtual Segment 
IDentifier)。 这个虚拟地址由24位的 VSID 和逻辑地址的低28位并接而成，如图 5-4 所示。这就 
创建了一个新的52位地址，因此能够处理更多的存储进而防止冲突。 _ 

例如，计算机要访问存储位 S 0 xl 3572 4 68 (—个32位地址）。髙4位 (0 x 1) 指示计算机应 
该査看段寄存器#1。进一步假设这个段寄存器包含数值 OxAAAAAA (24 位）。将该值与最初 
存储器地址并接为一个52位的地址 0 xAAAAAA 3572468。 另一方面，如果另外一个程序要访 
问同一个逻辑地址，但是段寄存器内的值是 OxBBBBBB ， 第二个程序的地址将是 OxBBBBBB 




第 5 章 通用体系结构 问題: 实际计算机 91 


3572468。因此，两个程序访问同一个逻辑地址，然而得到两个不同的 VSID 。 这就解释了局 
部变量如何能在两个不同的程序中拥有不同的存储地址。 


逻辑地址（用位表示) 


H 位 28位 



虚拟段铋识符 
(52 位） 


办 标识符 (40(4) 偏 移被 (12(4) 


页表 (20 位) 


物理地址 （32 位） 


阁 5-4 理想的类 PowerPC 的虚拟存储结构图 


当然，还没有计算机拥有 2 52 B 存储器（即 4 PB )。 目前的物理存储器实际上还要通过另外 
一个表来访问。物理存储器被分为页面，每个页面大小是4196字节 （2 I 2 B )。 每个52位的虚拟 
地址可以被认为由40位的页标识符（这是一个24位 VSID 和一个从最初逻辑地址中截取的16位 
页标识符）和一个12位的页内偏移 ft 构成。计算机保存一组页表，实质上是哈希表，用一个 
20位数作为每页的物理位置。通过査表，40位的页标识符被转换为20位的物理页地址。在这 
个过程的最后，最终的32位物理地址只是页地址再加上偏移量。 

这并不像听起来那么令人困惑，尤其是当你看了图 5-4 以后。不过这里可能涉及了大量工 
作。计算机为什么要进行这样的过程？这样做有几个好处。首先，不是每个虚拟存储器的页 
面都需要被保存在物理存储器中。当页面不经常使用时，可以将它们换出，然后将它们保存 
在长久的存储设备中，例如硬盘。（这是谈论“虚拟存储”的最初原因，即计算机能够访问并 
非实际的内存单元，而是硬盘。这使得计算机以速度损失为代价来运行比物理存储空间大得 
多的程序。）另外一个好处就是通过改变段寄存器内的数值，同一逻辑地址可以指向不同的物 
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理地址。最后，基于按页处理的方式也在一定程度上增加了安全性。页表中的指定页能够标 
记为“管理独有”，这意味着只有管理级程序能够在该页面进行读出或写入。类似地一个页面 
也可以被标记为“只读”（程序能从该页面读出数据但不能向该页面写入数据），“只有管理 
者写”（用户级程序能够从中读取数据，但是只有管理级程序才能写入），或者“读/写”全 
都包含（任何程序可对该页进行读/写）。这将防止用户程序误写操作系统的重要数据。 

5.4 外设优化 

5-4.1 忙-等待问题 

为了最佳地发挥外设的性能，外设一定不能阻止 CPU 做其他有用的事情。计算机如此的快 
速以至于它们几乎比任何其他的物理过程速度都更快。举一个简单的例子，一位熟练的打字 
员每分钟能键入120个字，这意味着大约每十分之一秒键人一个字符。一台 1 GHz 的计算机在两 
次按键之间能够完成100 , 000 , 000个数的加法。因此，计算机应该能够在执行字处理程序的 
间时去做很多数字处理操作。但是计算机在进行操作时如何能够及时地响应键盘的请求呢？ 
处理这一问题的一个笨方法就是轮洵，定期査看是否有事情发生。用髙级伪代码可将这 
个操作描述如下： 
while (没有键按 
等待一会儿 

辨识出按 K 什么键并 R 做相关的寧情 

轮询不能有效地利用 CPU , 因为 CPU 不得不花费很多时间反复确定是否有事情发生了。 
这也是为什么轮洵有时被称为忙-等待，因为计算机忙于等待按键而不能做任何其他有用的 
工作。 

5.4.2 中断处理 

处理期待中的未来亊件的更聪明的方法是建立一个程序密切监视事件的发生并且做相关 
的处理。当事件发生时， CPU 将中断当前的任务，然后利用先前建立的程序去处理该事件。 

这就是大多数计算机如何处理期待伹不可预知事件的一般做法。 CPU 建立多个不同种类 
的中断信号，中断信号由预先规定的事件产生，例如按键。当此类事件发生时，标准的取指- 
执行周期要有些变化。 CPU 不再加栽并执行 PC 所指的下一条指令，而是査阅包含中断程序位 
賢的 中断向量表。然后将控制转移（就好像通过 call 或 jsr 转向一个子例程一样）到该位置， 
专用的中断处理程序将被执行以便完成所需的任何处理^ (在具有标准编程模式的计算机中， 
这一控制也标志着从用户模式切换到管理模式。）在中断处理程序的最后，计算机返回（就像 
从子程序中返回）到主任务。 

在大部分计算机中，可能的中断编号是从0到一个小的数值（比如10)。这些数与编入到 
中断向董表中的位置对应。当0号中断发生时， CPU 就会跳转到中断向量表中的位置0 x 00,并 
且执行该处所存储的代码。如果1号中断发生， CPU 则跳至0 x 01，依此类推。通常，向最表内 
的中断位置处保存的只是一条转移指令，用来将控制转移到真正完成实际工作的代码块上。 

这种中断处理机制也可以推广到系统内部事件的处理。例如， CPU 分时可以通过设立一 
个内部定时器进行控制（这类定时器如何工作的细节将在第九章讨论）。当定时器到达满计时， 
就会产生一个中断，致使计算机首先从用户模式切换到管理模式，然后跳转到中断处理程序， 
并由中断处理程序将当前程序环境上下文换出，然后换入接下来要执行程序的上下文。定时 
器然后可以重启，并且为新的程序恢复计时。 
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5.4.3 与外设的 通信： 利用总线 

正如第一章所讨论，数据必定要在 CPU 、 主存和外设之间通过一条或多条总线移动。这 
好比可通过多条路从你家到商店；行程可能快一些或者慢一些，它取决于道路的质量、司机 
的技能以及交通流量。无论是计算机还是购物者，都希望行程尽可能地快。 

关于总线的典型使用有两个关键的问题。第一，从电气角度讲，总线通常就是将所有部 
件同时连在一起的一组线。这意味着总线担当了小规模的广播媒介，挂接在总线上的每个外 
设可以在同一时间获得同样的信息。第二，一个时刻只能有一个设备向总线发出信息：如果 
键盘和硬盘都要向总线发送数据，那么谁也不能成功发送。要成功地利用总线，各部分都需 
要遵循戒律。这个戒律以严谨的通信协议的形式表现。一个典型的总线协议可以包括 CPU 发 
出一个开始 START 消息，然后发出某个设备的标识。总线上的每个设备都能收到这两个消息， 
但是只有指定的设备会响应（一般会用 ACKNOWLEDGE 应答）这个消息。所有其他的设备 
都被这个 START 消息警示不能进行通信，直到 CPU 完成并且发出类似 STOP 停止消息。此时只 
有 CPU 和指定的设备允许使用总线，这样就减少了竞争和交通流量问题。 

5.5 本章回顾 

• 作为虚拟机， JVM 不受基于物理芯片体系结构在设计和性能方面的实际影响限制。 

•随矜芯片市场的竞争，工程师们已经开发了很多技术以便获取芯片的最佳性能。这包括 
在安全和速度两方面的改进。 

•一种获得用户级性能的方式是改善芯片的箪本指标数字——大小、速度和延时，但这通 
常是一个困难并且昂费的过程。 

•另外一种改善系统性能的方式（从用户 角度） 就是允许在一个时刻执行多道程序。通过 
分时，计算机能够做到这一点，这里程序在非常短的瞬间执行，并且程序会换入换出。 

• 当工程师们知道在所设计的计算机上运行何种程序时，他们就能针对这些程序创逨专用 
指令和硬件。计算机游戏就 M 于这样的程序，游戏程序对干计算机的图形处理能力有特 
别的需求。 Pentium 处理器就提供*本的机器级指令以便加速图形性能。 

•一个时刻执行多条指令的并行也能提高性能。在间时执行的指令种类方面， SIMD 并行 
不同于 M 1 MD 并行。 

•取指-执行周期被分为若千阶段，每个阶段独立并且同时执行，这种被称为流水化的并 
行形式能够带来显著的性能增强。例如，在执行一条指令的同时去取下一条指令，即便 
存在延迟，计算机也能够获得对呑吐率100%的提髙。 

• 超标 fi 体系结构将整个流水阶段复制若干次，借助于同时做若干同样的事情来提供另外 
一种加速处理的方式。 

•通过采用 cache 存储器加速 i 方问经常使用的数据能够减少存储器访问时间。 

•存储器管理技术，如虚拟存储器和换页，能使计算机更快并且更;安全地访问更大容量的 
存储器。 

• 中断取得 了显著 的性能提高，避免了计算机检测是否有预期事件发生而浪费时间。 

• 设计适合的总线协议能够加速计算机内部数据传送，减少对传输时间片的竞争。 

5.6 习题 

1. 实际计算机的哪些存储限制是 5 VM 堆栈能够忽略的？ 


真实计算机 


2. a . 128位的 CPU 与64位 CPU 相比有何优势？ 
b . 这些优势有什么重要意义？ 

3. —条保存主存栈全部内容并且从主存检索内容的专用指令对于 JVM 有帮助吗? 

4. 如果由你负责，你打算对 JVM 体系结构做何增强？为什么？ 

5. 除了课本中提到的内容，给出两个实际的流水化示例。 

6. 你如何将转移预测应用到 look 叩 switch 指令？ 

7. 除了课本中提到的内容，给出两个超标量处理的实际示例。 

8. cache 如何决定保存什么内容以及删除什么内容？ 

9. 解释存储管理如何允许两个程序同时使用同一个存储位置却没有冲突？ 

10. 存储器映像 I/O 与虚拟存储系统是如何交互的？ 
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6.1 背景 

1981年 IBM 发布了它的第一代个人计算机，此后得到广为应用并且各种机型被统称为 
IBM - PC 。 作为一个相对低成本的计算机，并且由家喻户晓的 IBM 公司生产（尽管 Apple 公司 
已经存在，但是只限于爱好者市场，当时几乎没有其他的计算机公司存 在）， 它取得了巨大的 
成功，几乎立刻占领了微型计算机的购买市场。 

当时计算机只有 64 K 内存，没有硬盘，人们只能从5^英寸软盘上向计算机加载程序。这 
个计算机内部的芯片是由 Intel 公司制造的，型号是8088。今天，8088的后代计算机仍然基于 
最初的8088设计。 

从技术上讲，8088是第二代芯片，它基于先前的8086设计。两个芯片之间的区别很小， 
都是16位计算机，段式存储器体系结构。其主要不间在于8086有一个16位的数据总线，所以 
一个寄存器的全部内容可由一个总线操作送至存 储器。 8088只有8位数据总线，所以从 CPU 到 
存储器之间的存储或加载操作需要的时间要长一些，但是8088芯片的生产成本要便宜一些， 
这就降低了 IBM-PC 的整体价格（因此提高了其市场份额）。 

随若基于8088的 IBM - PC 的成功， Intel 和 IBM 有了一个稳固的冇场并且改进了芯片。 
80286 (尽管80186也有设计，但它在个人计算机市场上销售一直不看好）将安全特性融入了 
不安全的8088，并且运行的速度也比8088快很多。80286芯片是 IBM - PC/AT (Advanced 
Technology ,先进 技术） 的基础，也被称为 PC / AT 。 

80386增加了寄存器的数妖，并且寄存器的位数都变大了（每个都是32位），这使得芯片 
能力 E 强。随后的80486和 Pentium (又名 80586) 又有进一步的改进，这将在第8章中详细讨 
论。这些后期的芯片，加上最初的芯片，通常被称为 80 x 86 系列。 

从某种意义上说，8088只是一道历史 风景， 即便作为低成本的微控制器（例如，这类芯 
片可以算出如何烘烤面包，或者电梯应停在哪层），它仍可与其他基于更现代原理和技术的体 
系结构比美。然而 ， Intel 80 x 86 系列的后代产品为了维护已有用户的利益都遵循向后兼容的原 
则。例如，在1995年，当 Pemiuixi 发布时，上百万人正在他们已有的80486系统上运行软件。 
Intel 设计者们没有强迫人们去购买新的软件以及新的硬件（这可能导致他们从其他的公司购 
买软件和硬件，如 Apple ), 而是确保为486编写的程序仍然能够在 Pentium 上运行。由于这个 
决定在各个阶段都没有改变，这使得在1981年为 1 BM - PC 编写的程序仍然能够在现代的 P 4 上运 
行。当然，它们无法利用现代技术的改进之处，例如速度的增加（最初的 PC 以 4 MHz 运行， 
而现代系统的运行速度是它的1000倍），改蕃的图形分辨率，甚至现代设备的使用，如鼠标、 
USB 设备等。由于向后兼容的特性，理解8088对于理解现代 Pentium 体系结构仍然是重要的。 

6.2 组织和体系结构 

6.2.1 中央处理单元 

在总体抽象层次上看 ， Intel 8088 CPU 和大多数其他处理器非常相像，包括 JVM (图6-1)。 
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数据保存在一组通用寄存器中，由取入到控制器并且在控制单元中被译码的指令对数据进行 
操作，并遵循 ALU 电路所定义的算术运算法则。不过存在一些微妙但很重要的差别。 

第一个差别就是由于8088是物理芯片，它的能力（例如，寄存器的 数量） 是固定不变的。 
8088包含8个所谓的“通用寄存器”。不像 JVM 栈，这些通用寄存器并未以特别的方式被组织， 
它们以名字而不是编号命名。这些寄存器命名为 

AX BX CX DX 

SI DI BP SP 

尽管它们被称为通用寄存器，但是大多数寄存器都与附加的硬件有关，以便某些操作执 
行得快一些。例如， CPU 有专用的指令使用 
CX 作为循环计数器， AX / DX 是唯一用于优化 
整型乘法和除法的寄存器对。 SI 和 DI 寄存器 
支持高速存储器传输 （ SI 和 DI 分别代表源索 
引和目标索引），而 BP 寄存器常被用于栈指令 
指向局部函数变量和局部参数。 

除了这些寄存器，8088还有一些特殊用 
途的寄存器，它们不用于一般的计算中。这 
些寄存器中烺甫要的是 〖P (指令指针）寄存 
器， IP 保存将要执行的下一条指令的地址。 

(在其他的机器中，这个寄存器可能被称为程 
序计数器或者 PC , 它们的意义相同。）四个段 
寄存器 （ CS ， SS ， DS 和 ES ) 用干支持访问 
更多的存储器，并且使得对存储器的访问结 
构化。最后 FLAGS 寄存器保持一组单独的位 
描述当前运算的结果，如上一个操作结果是 
否为0或正数，亦或是一个负数。 

这些寄存器都是16位宽。这意味着8088 
有一个16位的字宽，大部分操作能够进行16 图 6 -1 S 0 88 CPU 示意图 

位处理。如果由于某些原因程序员想要使 
用小一些的表示，程序员可以使用通用寄 
存器的一部分。例如， AX 寄存器可以被划 
分为两个8位的寄存器使用，它们被称为 
AH (高）和 AL (低）寄存器（图6-2)。所 
有的子部分构成同一个完整的寄存器，所 
以任一部分的变化都会影响整个寄存器的数值。如果你向 AX 寄存器加载数值 0 x 5678, 这将会 
给 AL 陚值 0 x 78, 而给 AH 陚值0 x 56。类似地，此时将 AL 清零就会使 AX 寄存器的内容变为 
0 x 5600。这种划分对于所有的通用寄存器都成立《 BX 寄存器可以被划分为 BH 和 BL 寄存器， 
等等。 

8088寄存器中几乎所有的值都是以】6位有符号补码形式表示的。不同于 JVM , 8088也支持 
无符号整型表示。在大多数操作中（例如，移动数据，比较两个位模式是否相同，甚至是两个 
数相加），8088并不关心给定的位模式是有符号还是无符号的量，但是少数情况下存在两种不 
同的操作。例如，两个无符号相乘使用助记符 MUL , 而两个有符号量相乘则使用助记符 IMUL 。 



图 6-2 8088中寄存器划分 








系 6 章 Intel 8088 97 


上述定义的寄存器用于8088计算机可完成的大部分操作，从存储器访问到控制结构和循 
环，以及髙速整型处理。关于高速浮点处理，设计了一个独立的芯片作为浮点单元 （ FPU )。 
这个 FPU 有它自己的8个寄存器，每个寄存器80位宽用于高精度运算，并以栈的方式组织。保 
存在这些寄存器中的数据采用专用的浮点表示，与前面讨论的标准相似，只是尾数和指数的 
位数较多。还有一些附加的寄存器，两者都是 FPU 的一部分（例如， FPU 有它自己的指令寄存 
器）并且用于某些专用运算。 

6.2.2 取 指-执行周期 

8088的取指-执行周期与 JVM 的几乎相同， IP 寄存器中的数值用于表示存储器地址，该地 
址（由 IP 寄存器指示）中的数值被拷贝（取）到指令寄存器中。指令一旦被取出， IP 寄存器 
内的数值即增1 (指向下一条指令），取出的指令由 CPU 执行。 

唯一的限制就是 IP 寄存器自身的容董。由于只有16位宽， IP 寄存器只能访问65000个不同 
的地址，因此琅多取得65000条不同的指令。.这看起来限制了程序的大小，没有程序能够超出 
64 K 。 幸运的是，下一节描述的存储管理技术稍许缓解了这个限制，实际上是借助其他寄存器 
的附加位来扩大地址空间。 

6.2.3 存储器 

对干一个16位字宽的计算机，每个寄存器可容纳2“（约 65000) 个模式。这意味者任何寄存器 
(例如， IP ) 拥有的存储器地址可以指向65000个不同的位置，以现代的标准看这绝对不够，简直枉 
贽我们的努力。（来做一个快速的现实 核査： 排版这本书的文本处理软件占用了251864个存储器位 
这还不包括编辑和打印软件。）即使在1981年， 64 K 字节存储器也被认为是非常小的容發。 

关于这一问题有若干解决方案。最容易的方案是使每个模式/访问位 S 不指向单一的存储 
器字节，而是字（或者是更大的单元）。这在保存一个比字小的数据项（如字符串中的字符） 
时会降低效率，但是却使访问更多的存储器成为可能。 

8088设计者采用稍加复杂的方法。8088的存储器被分割为 64 KB 的段。每个段包含普通16 
位寄存器能最多访问到的存储器字节，但是这些地址被解释为相对基地址，基地址由特有的 
段定义。顾名思义，段定义保存在所谓的段寄存器中。 

遗憾的是，数学在这一点上也很难处理。段寄存器本身是16位宽。真正的（有时称为绝 
对的）地址是由相关的段寄存器值乘以16 (等价于左移4个二进制位置，或一个十六进制位 S ) 
再与相应的通用寄存器或 IP 中的值（称为偏移 ft ) 相加。例如，如果段寄存器中保存的值是 
OxCOOO , 这将定义段从 OxCOOOO 开始。偏移量 0 x 0000 将对应 （20 位）位 S 0 xC 0000, 而偏移 
*0 x 35 A 7 将对应绝对位 360 XC 35 A 7, 这些位置中的每一个都对应一个字节。 

关于段的起始一定与 64 K 的倍数对齐并没有特别的理由。加栽数值 0 x 259 A 将定义段的起 
始地址为 0 X 259 A 0。 事实上，任何一个以十六进制值0结尾的位置都是一个可能的段起始地址。 
在上述定义的段中，段值 0 x 259 A 加上假定的偏移量 
0 x 8041 会生成绝对地址 (0 x 259 A 0+0 x 8041) 或者字节 
位置 0 X 2 D 9 E 1。 为了简化起见，这样的地址对通常被写 
成段： 偏移量的形式，例如 259 A : 8041 0 在这种模式中， 

合法地址从 0 x 00000 (0000 : 0000) 到 OxFFFFF ( F 000 : 

FFFF )。 应该注意的是，通常有很 多段： 偏移量对指向 
给定的位置。位 SF 000 : FFFF 也是位置 FFFF : 000 F ， 

同样也是位置 F 888 : 777 F (如图6-3)。 


地址 


COOO :35 A 7 
段偏移 



实际地址 C 3 5 A 7 

图 6-3 段： 偏移计算图示 
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按通常的习惯，四个段寄存器与不同的偏移量寄存器联合定义不同的存储类型及应用。 
它们对应于 

•CS (代码 段）： 代码段寄存器与 IP 联合定义机器可执行的指令（程序代码）在存储器中 
的位置。 

•DS (数据 段）： 数据段寄存器与通用寄存器 AX , BX , CX 和 DX 联合控制对全局程序数 
据的访问。 

•SS (栈 段）： 栈段寄存器与栈寄存器 （ SP 和 BP ) 联合定义栈帧，函数参数和局部变量， 
下面将要讨论这个内容。 

•ES (附加 段）： 附加段寄存器用于保持额外的段。例如，如果一个程序太大不能装在单 
独一个代码段中。 

即使采用段式存储器模型，计算机也只能访问2 2 <>个不同的位 S , 即 1 MB 。 即便这些存储 
空间在实际中也不是完全都可使用的，因为一些空间被预留给视频存储而不是通用的程序存 
储。实际上，程序员只能访问前 512 K 用于程序的空间。幸运的是，当计算机存储器超出 1 MB 
在财力上成为可行的时候，8088的设计已经被同系列的后代产品超越了，包括 Pentium 。 
Pentium 中存储器访问有了很大的不 M , 从某种意义上避免了 1 MB 的限制。 

6.2.4 设备和外设 

现代计算机能够附带一批外围设备，从简单的键盘和显示器，到商业附件如扫描仪和传 
真机，以及真正的非普通专用设备如售货机、烤箱以及医学影像设备。由于基于 80 x 86 的机器 
如此普遍，因此设计并制成与8088接口的设备很常见。 

然而，从计算机（以及计算机设计者）的视角，通过采用标准化的接口设计和端口，任 
务从一定程度上得到了简化。例如，很多计算机的主板上带有 IDE 控制器芯片，并且 IDE 控制 
器直接与系统总线连接。这个 1 DE 控制器同时附带一组连线，这组连线可以插入 IDE 形式的驱 
动器。当该控制器从系统总线上获得相应的信号，它负贵解释这些针对某个驱动器的 信号。 
所有硬盘制造商都能完全确保它们遵从 IDE 规范并且适应任何 PC。PCI (Peripheral 
Component 〖 merconncctiori 外围组件互连）规定了类似的标准化，将主板与各种设备直接连接。 
也许 最广为 使用的连接是 USB (Universal Serial Bus 通用串行总线）连接。这为任何支持 USB 
的设备（从鼠标到打印机）提供了标准化的髙速连接。 USB 控制器本身会査询关联其上的任 
何设备，发现它们的名称、类型以及它们要做什么（以及它们如何做）。 USB 端口也能提供能 
源，并且几乎以网络的速度与这些设备通信。然而，从程序员的视角， USB 的优势是程序员 
只需编写程序与 USB 控制器通信，大大地简化了与设备通信的任务。 

6.3 汇编语言 

6.3.1 操作和寻址 

8088在教科书中是一个 CISC (Complex Instruction Set Computing 复杂指令集计算）典型 
示例。 CISC 中能执行的操作集合庞大，并且操作本身的功能很强大。 CISC 设计的一个副作用 
是一些简单的功能能够使用不同的机器操作以多种不同的方式执行》这通常意味着 Intel 的设 
计者们为某些寄存器提供便捷使用的优化功能。 

由于寄存器有名称，不像在 JVM 中使用编号或索引，基本运算格式就有所不同。在 JVM 
中，只要简单地指明 “ add ” 就足够了，位于栈顶的两个数即被自动相加，并且在加法结束时， 
结果就被自动地留在栈顶。在8088中，情况就不同了 *程序员必须指明加数被保存在哪里以 
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及和被存放在哪里。 

由此，8088大多数指令采用两变量的指令格式， 如下： 

助记符 操作数1,操作数2, 可能的注释 

通常第一个操作数被称为目标操作数（有时简写为 dst ), 而第二个操作数被称为源操作数 
(简写为 src )。 基本思想是数据取自于源（源在其他情况下是不被改变的），而计算结果保留在 
目标中。因此，对于 CX 中的值与 AX 中的值相加（助 记符： ADD ) (并且将和保存在 AX 中）， 
8088汇编语言指令将是 

ADO AX , CX I 真正的含义 AX = AX+CX 

由于有8个16位通用寄存器，所以有64 (8 X 8) 个不同的加法指令。事实上，既然可以将 
16位或者8位值相加，就会有很多的表示，例如 

ADD AH , BL ; AH ■ AH ♦ BL 

8088 还支持若干种寻址方式或者可以采用不同方式将给定的寄存器模式解释为访问不同存 
储位置。对于以上方面，最简单的例子就是寄存器中保存的值就是计算中所用的值。这被称为 
寄存器方式寻址。与其相比，也可采用立即方式寻址，这种方式将数据本身写入程序中，如 

ADD AX , 1 ; AX - AX + 1 

注意，这只在 1 是第二个（源）操作数时才有意义。对目标操作数使用立即方式寻址将会 
导致错误产生。也应该注意到这是 CISC 计算的强势，因为这种操作在 JVM 中将占用两条单独 
的指令-条指令加载整型常数1而另外一条指令执行加法。 

立即数或者寄存器值也可以用做存储器地址，告诉计算机这不是数值而是要找到该值 
的地址。例如，如果 BX 包含一个8位数值的地址，我们用下面的表示将 CL 中的当前值与其 
相加。方括号 （[]) 代表寄存器 BX 使用间接方式（稍后将讨论直接方式）作为存储单元的 
地址： 

ADD CL , [ BX ] , CL < L + 用 BX 索引的存储取元中保存的值 

这是一个难点，因此我们多做些研究。注意下面两条指令所完成的功能不同： 




[ BX ], 1 


. BX 增 1 

. BX 指向的值埘1 


它们如何不同？让我们假设存储在 BX 中的值是4000。执行第一个操作将使 BX 中的值增 
加，等于4001。相比之下，第二个操作没有改变 BX 的值（仍为 4000), 而是增加了保存在存 
储单元4000中的值。（实际上，这里有一个错误，原因将在 6.4.1 节讨论。本质上，尽管我们知 
道4000单元中有一个值，但是我们不知道它是字节，字，双字，还是其他的类型。因此计算 
机怎么能知道增加的单位大小呢？）类似地，执行 

ADD AX , [4000 h ] . 将 4000 h 中的值与 AX 相加 

査看存储单元 0 x 4000 (方括号中的数由于尾部的 h 被自动解释为16进制的最）中保存的16位的 
值，然后将其与 AX 中存储的值相加。在这个例子中，没有涉及寄存器而是采用了常数定义的 
存储位置，我们将此称为直接方式。 

这些寻址方式能够用于几乎任意组合的 ADD 操作中，但是有两个例外。例如，将一个寄 
存器与另外一个寄存器相加，将一个存储单元与寄存器或者一个寄存器与存储单元相加，或 
者将一个立即值与寄存器或者存储器内的值相加都是合法的。然而，将一个存储单元与另一 
个存储单元直接相加是不合法的；其中的一个操作数一定要放在寄存器中。将立即值作为加 
法的目标地址也是不合法的。下面的一组操作中，前面的5个是合法的，而后面的2个是不合 
法的。 
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AX . BX ,寄存器-寄存器 

AX , [4000] ,存储器-寄存器 

AX , 4_ ,立即值-寄存器 

[4600], AX ,寄存器-存储器 
[4000] , 4000 . 立即值-存储器 
[3000] , [4000] «不合法！存储器-存储器 
4000, AX . 不合法！立即值-任意 


上述每个操作以及寻址方式都用略有不同的机器码表示。在机器码中，由于使用 AX 寄存 
器指示目标的8088特殊（而快速）指令的存在而增加了复杂性。聪明的程序员（或者编译器) 
利用这类指令将数据放在 AX 寄存器而不是其他寄存器能够使程序更快更短。（我们在 JVM 中 
已经看到了这类指令，即用 iload _ l 作为更加通用的 lload 指令的捷径办法。难以理解的是, 
大多数汇编器对于高速的 AX 指令不使用有区分的助记符，而是汇编程序自身去识别这个特殊 
用途指令的使用，然后自动生成机器码。这意味着如果汇编器足够聪明汇编语言程序员就不 
必为这些指令而担忧。）这种为高速运算而设计的寄存器有时也被称为累加器，严格地说， 
8088有两个不同的累加器一或者至少同一个寄存器的两个部分。 AX 寄存器作为一个16位的 
累加器而 AL 寄存器用作一个8位的累加器。 

6.3.2 算术指令集 

对于大多数算数操作常见的是两操作数格式。例如，可用 SUB 指令完成两个数的减法而 
不是两个数相加： 

SUB BX . AX ; BX - BX - AX 

8088 还支持存储器与寄存器之间的 MOV 指令，也同样使用两个参数的形式，其中第一个 
操作数是目标而第二个操作数 是源。 8088也使用同样的格式支持 AND , OR 和 XOR 指令 • 这 
些指令也都有专用的累加器捷径。 

也有一些一个参数的指令，例如 INC (自增 ）， DEC (自 减 ）， NEG (求反——即乘以一1) 
和 NOT (参数所有的位变反，等价于与一个各位全为1的参 tt ： 做 XOR 运算操作)。格式非常 简单： 

DEC AX ; AX - AX - 1 

乘法和除法都比较复杂。原因很 简单： 当你要两个16位整数相加（比如说）时，大约会 
得到一个16位的结果，该结果仍可以装入一个16位的寄存器。当你要将这两个数相乘时，结 
果就可能长达32位（一个16位的寄存器无法容纳）。类似地，整数除法实际产生两个结果，商 
和余数（例 如： 22/5=4余数2,就像小学算术）。因此，8088为了乘法和除法的结果增补附加 
的寄存器一由于硬件的复杂性，8088只能使用一些针对这些操作特定的寄存器。 

要将两个数相乘，第一个数一定要出现在累加器（适于任何位宽）。乘法指令本身 （ MUL ) 
有一个参量，该参量是乘法的第二个数。乘积 
被放在一个寄存器对中，确保乘法不会溢出。 

表 6-1 示意乘法操作中信息向哪里流动以及如 
何流动。 

( DX - AX 寄存器对有时被缩写为 DX : AX , 

AH : AL 对通常缩写为 AX 寄存器 J 

将两个数59和71作为16位值相乘，可用的代码片断如下。首先，（十进制）值59通过 
MOV 指令被加载到 AX 寄存器，值71被类似地加载到 BX 寄存器。然后累加器 （ AX ) 中的值与 
BX 中的值相乘。结果将被留在 DX : AX 。 特别地， AX 将保存结果的低16位（十进制值4189, 
保存为 0 xl 05 D )， 而 DX 保存高16位，在该例中将是全0。 


表 6-1 8088乘法倌息流 


乘数 


披乘数 


乘枳的高 
半部分 


乘积的低 
半部分 


AL 

AX 


参 ft 
参量 


AH 

DX 


AL 

AX 


lADDADDi i 




. AX 获得乘数 
, BX 获得被乘数 


MOV AX , 59 
MOV BX , 71 
MUL BX 

实际上有两种不同的乘法指令，一种用于无符号整数乘法 （ MUL ) 而另一种用于有符号 
整数 （ IMUL )。 两种情况中寄存器用途是相同的，唯一区別是被乘数和乘数的最高位被当作 
符号位还是数值位。例如，值 OxFF (作为8位 的量） 要么是-1 (作为有符号量）要么是255 
(作为无符号量）。用 OxFF 与其自身相乘会导致 OxFFOl 存放在 AX 寄存器，而 IMUL 指令将得到 
0 x 0001 (因为一 1与其自身相乘结果当然是1)。 

除法使用同样复杂的寄存器集，但是次序相反。被除数被放入寄存器对中，要么是 
AH : AL 对，要么是 DX : AX 对。除法的参爱用作除数。商被保存在寄存器对低半部分而余数被 
保存在髙半部分。使用先前的 例子： 


MOV DX , 0 
MOV AX , 22 
MOV BX , 5 
DIV BX 


DX 滴零 
DX : AX =22 
除数是 5 
执行除法 
现在 DX 包含 2 
现在 AX 包含4 


类似于乘法，除法也有两种指令， DIV 和 IDIV , 分别执行无符号和有符号除法。 


6.3.3 浮点运算 

8088 FPU 几乎是单独的自包含计算机，有它自己的寄存器和特殊的指令集，专门用来执 
行浮点操作。实际上它是一个孽独的自包含的芯片，以型号8087作为数学协处理器出售。数 
据在8088主 CPU 和协处理器之间传送。未命名的8087寄存器是8个80位宽的存储单元组成的栈 
(是的， 就像 JVM ), 再一次地，类似于 JVM , 指令集指明操作类型以及数据表示类型。 

FPU 能够保存和执行3种不同类型的 数据： 标准的 IEEE 浮点数，整数和专有格式称为二进 
制编码的十进制数 （ BCD ), BCD 中毎4位一组代表一个十进制数字的二进制编码。这个格式 
常被 IBM 主机采用，因为对于工程师们很容易将这个二进制模式重新解释为（直观的）十进 
制数字，反之亦然。在8087内部，所有这些格式都被转换成80位的格式并且以80位格式保存， 
这在本质上比 〖 EEE 定义的标准格式更为精确。 

所有的 FPU 操作都以字母 F 开头 UVM 程序员应该熟知这一点）并且如人们所期望的对栈 
顶进行操作，就像 JVM 或者逆波兰计算器。 FADD 指令弹出 FPU 栈顶两个元素，将它们相加， 
然后将结果压入栈。其他的算术操作包括 FSUB , FMUL 和 FDIV , 其功能如所期待的那样。有 
两个附加 操作： FSUBR 和 FDIVR ， 其执行反向的减法（除法），将第二个元素减去栈顶元素 
而不是从栈顶减去第二个元素。 


补充资料 

其他 FPU 变置格式 

尽管 FPU 总是使用内部80位“扩展精度”格式进行操作，数据在主存中却以多种形式 
取/存。在取/存时逬行转换，取决于所用的操作助记符。有很多不同的指令，大多数都有 
几种解释， 如下： 

•整 数： 用 FILD 指令取16位或者32位整型数据。在后来的机器中.这条指令也能取64 
位的量。 

• BCD 整数： 用 FBLD 指令取80位的二进制编码的十进制格式整型数据。 

•浮 点数： 用 FLD 指令取32位，64位或者80位长的浮点数。 

这些量一旦取出，它们就被 FPU 视为相同。要存一个值.在上述的助记符中用 “ ST ” 代替 “ LD ”。 
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还有一些特殊指令（如 FSQRT ) 处理常用的数学函数，如平方根和三角函数。 

一用 FLD 指令能将数据压入（取入） FPU 栈。这实际上以3种形式 表现： FLD 从指定的存储 
单元取32位或64位 IEEE 浮点数， FILD 从存储器取16位或32位整数（并将其转换为内部浮点数）， 
以及 FBLD 从存储器取80位 BCD 数（并对其进行转换)。有一些使用常数的特殊 操作： FLD 1 取 
1， FLDZ 取0, FLDf > I 取80位表示的 ji ， 还有一些其他的指令指定常用对数，例如2的自然对数。 
要将数据从 FPU 移入存储器，采用 FST 指令的一些变形一再次说明，有对整型 （ FIST ) 和 
BCD ( FBST ) 存储的变形。一些操作还有额外的变形，尾部以 P 标记，当操作完成时弹出栈 
(例如， FISTP 将栈中的浮点数弹出并保存为整数）。 FPU 的一个限制是数据只能从存储器取或 
者存至存储器，不能直接从 ALU 寄存器取。因此以下语句 

FILD AX ,不合法！不能使用寄存器 

就是不合法的，存放在 AX 中的值应首先移入一个存储器字位置然后再从该位置取出 如下： 
yv Location,AX , 将 AX 内容移入存储器 

FILD Location 丨 从存储器取人 FPU 


6-3.4 判定和控制结构 

如同大多数汇编语言，8088的控制结构建立在无条件和条件跳转指令基础上，在这里控 
制被转移到源码中声明的某条标号语句。如同 JVM ， 这一处理实际上通过偏移量计算以及将 
程序计数器当前的地址与偏移 ft 相加/减完成^跳转指令（助 记符： JMP ) 的格式对于我们来 
说也是熟知的： 

LABEL ： JMP LABEL . 愚蠢的无限循环 

条件跳转使用 CPU 中 FLAGS 寄存器中的一组二进制标志位 （ flag )。 这些标志都是用独立 
的位来描述最近计算结果，例如，当且仅当最近操作 （ ALU 中）结果是零时，零标志 ZF 被置 
位。符号标志 SF 包含*高位（如果结果是有符号整数该位将是符号位〉的副本并且当且仅当 
燉近结果是负数时该位被置位。当且仅当最近计算产生一个进位时，进位标志 CF 被》位，（当 
执行无符号数计算时） CF 标志计算结果太大寄存器无法容纳 • 溢出标志位 OF 处理类似的情况， 
这里是指当执行有符号数计算时对于寄存器来说太大（或太小)。还有一些其他的标志位，但 
是上述例举的都是锒常用的标志位。 

条件跳转的助记符形如 ^ condition ”， 这里 - condition " 描述跳转成功时的标志设定。例 
如， JZ 的含义是如果零标志被 置位則 跳转，而 JNZ 的含义是如果零标志未被置位则跳转。我 
们可以以此来测试两个值是否相等： 

SUB AX , BX : AX - AX - BX 

JZ IS EQUAL • (-1) 

« 如果到了这里， AX 就不等于 BX 

]MP OUTSIDE : 

ISEQUAL : 

, 如果到了这里， AX 等 TBX 

OUTSIDE : 


. If/else 语句之后返回 


其他的条件跳转包括 JC/JNC (如果 CF 置位/淸零则跳转）， JS/JNS (如果 SF 置位/清零则跳转）， 
JO/JNO (如果 OF 置位/淸零則跳转），等等。遗憾的是，不是所有的标志都有这么清晰的算术 
解释，另一组条件跳转是处理算术比较，如“大于”，“小于或者等于”，等等。这些指令采取 
与算术关系相适的组合方式来解释标志。 

更加详细地说，这些跳转期望标志寄存器包含一个数减去另一个数的结果，就像上面刚 
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举例给出的示例片段（这是一个小谎言，稍后会更加详细解释 CMP 指令）。要确定一个有符号 
数是否比另一个大，可以使用 JG (如果大于則跳转）助记符。其他助记符包括 JL (如果小于 
则跳转 ）， JLE (如果小于或者等于则跳转）以及 JGE (如果大于或者等于则跳转）。这些助记 
符也以取负的形式存在 —— JNGE (如果不大于或者等于則跳转），当然，这等价于 JL ——事 
实上用两个不同的助记符实现了同一指令。类似地，存在 JE ， 等价于先前定义的 JZ , JNE 与 
JNZ 相同。 

对于无符号整数的比较，需要一组不同的指令。要理解其中的原因，考虑16位的量 
OxFFFF 。 作为有符号整数，它代表-1,小于0。作为无符号整数，它代表最大的16位数，略 

大于65000-当然它大于0。所以问题 “ OxFFFF > OxOOOO ? ”有两个不同的答案。取决于该 

数是否为有符号数。8088考虑到这个问题，提供了一组条件转移指令（即 M , JB , JAE , JBE , 
JNA ， JNB , JNAE , JNBH ) 用于比较无符号数。所以，要判定 AX 中保存的值能否装人8位寄 
存器，使用下面的代码 片段： 

. 8位安全测试版本1 

SUB AX , 100 h ,从 AX 屮减 

3 AE T 00 BIC • 无符号比较 

. 如果程序到 这里， 说明数据能装入8位寄存器 

3MP OUTSIDE 

T 00 BIC ： 

. 如果程序到这里，说明 AX 中的数据超过8位 

OUTSIDE ： 

,继续做所黹要的 T . 作 


这个代码段的一个问题是，为了正确设 S 标志， AX 的值必须被 修改。 一个可能的解决方 
法是要保存 AX 的值 （ MOV 该值到存储单元）并且在设覺标志之后再取回该值。这是可行的， 
MOV 指令不影响标志寄存器，能保持先前的设置。因此，我们可以*写8位安全测试，该测 
试稍微多用些空间和时间，代码如下： 

. 8位安全测试版本2 

MOV SOMEWHERE, AX 

SUB AX. ieeh 

MOV AX, SOMEWHERE 

JAE T00BIC 

« 如果程序到这黾，说明数据能装人 8 位备存器 
JMP OUTSIDE 

T00BIC ： 

»如采 稃序到 这里，说明 AX 中的数据太大 
OUTSIDE ： 

. 继续做所需要的工作 


• 将 AX 存入 S0HEWHERE 
. 从 AX 中臧去 2- 
. 恢复 AX 存入，不影响标志位 
,无符号比较 


Intel 指令集用一个专用命令提供了一种更好的方法。具体地，助记符 CMP 执行非破坏性 
减法。这条指令计算第一个数减去第二个数的结果（如上述例中所做），并据此设置标志寄存 
器，但是不在任何位置保存减法的结果。因此，重新将第一个版本改写 如下： 

. 8 位安 全测忒 版本 3 

CMP AX, 10eh 丨 比较 2 •与 AX 

JAE T00BIC . 无符号比较 

,如果程序到这里，说明数据能装入8位寄存器 
3MP OUTSIDE 

T00BIC: 

. 如果程序到这里.说明 AX 中的数据太大 
OUTSIDE: 

* 继续做所需要的工作 


该代码保持了第一版本的效率而又未破坏寄存器中的值。 
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除了这些相当传统的比较和转移指令之外， Intel 提供了一些专用指令（有些重复，不是 
吗？）支持有效的循环。 CX 寄存器协调这一目的。具体地，借助 JCXZ 指令，如果 CX 的值是0 
计算机就跳转。借助该指令，可以建立计数器控制的循环 


MOV CX , 100 

BEGIN ： 

. 做些有趣的事情 
DEC CX 
3 CXZ LOOPEXIT 
JMP BEGIN 
LOOPEXIT : 

. 现在在循环之外 


. 循环 100 次 


. 计数器减1 

I 如果完成 ( CX *0) 則退出 
. 返同开姶处 


甚至更简洁地， LOOP 指令处理递减和转移——它将递减循环计数器并且如果计数器未达 

到0时转向目标标号。因此，我们能将上面的循环简化为一条有趣的语句： 

MOV CX , 100 ,循环 100次 

BEGIN : ^ 

. 做些有趣的事情，当 cx«0 时退出 

LOOP BEGIN • 返回开姶处 

. 现在在循环之外 


使用浮点比较结果就难以处理了。基本问题在于标志寄存器位于主 CPU (具体在控制笮 
元）内， CPU 通过控制单元中的 PC 处理转移指令。与此同时，所有的浮点数都存放在 FPU, 
FPU 是与 CPU 完全独立的芯片。数据必须从 FPU 移入标志寄存器，这可通过一组特殊指令完成， 
这已经超出了讨论的范围。 


补 充资料 

好的。如果你坚持还可以继续 讨论。 FPU 提供 FCOM 指令和 FTST 指令， FCOM 比较栈 
顶的两个元素.而 FTST 将栈顶元素与 0 相比.这个比较结果保存在 ** 状态字”中.等价于 
标志寄存器。要使用这个信息，数据要移动.首先移入存储器（因为 FPU 不能直接访问 
CPU 寄存器），然后再移入寄存器（因为标志寄存器不能直接访问存储器），最后送到最终 
目标。完成笫一步的指令是 FSTSW (保存状态字，将存储位置作为它的唯一参量），第 
二步用普通的 MOV 将状态字移入 AX 足已，第三步使用专门的 SAHF (将 AH 存到标志寄存 
器）指令。一般的无符号条件跳转就可以正确工作了。这一过程的复杂性解释并阐明了编 
写计算机程序时使用整型变董速度快的部分原因。 


6.3.5 高级操作 

8088提供了很多操作，我们只能涉及其中的一部分。它们中的许多，也许是大多数，是 
执行常见任务的捷径，比起使用简单指令只需用较少的机器指令。 XCHG (交换）指令就是 
一个实例，它将源和目标参量的内容交换。另一个示例是 XLAT 指令，它使用 BX 寄存器作为 
表索引并且利用表中保存的量调整 AL 中的值.本质上， XLAT 是操作 AL=[|AL]+BX】 的简写， 
它通过几个步骤执行先前描述的一些基本操作。（如果你需要将一个字符串快速转换为大写表 
示，这将会很有用）。 

8088也支持对于字符串和数组类型的操作，为此要使用（另外一组）专用指令。我们将在 
6 .4.4节看到它们的一些使用，因为字符串和数组通常被存放在存储器中（寄存器容最不够大)。 

就像我们将要看到的，使用更多操作的趋势在系列中的后继成员中呼声更髙，于是指令 
集变得愈发庞大并且复杂，到了一种目前几乎没有程序员知道 Pemium4 全部指令细节的程度。 
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(这正是编写一个好的编译器既重要又有难度的原因。编译器愈聪明程序员就可以愈愚笨。） 

6.4 存储器组织和使用 

6.4.1 地址和变置 

8088存储器的段组织已经描述过。每个可能的寄存器模式代表存储器中一个可能的字节 
位置。对干较大的模式（一个16位字，或者32位 “ double ”， 甚至是80位 “ tbyte ”， 包含10个 
字节并且保存一个浮点值），人们能够增补两个或者多个相邻字节单元。只要计算机能够计算 
出有多少个字节在使用，访问不同容量的存储单元就非常简单了。 

遗憾的是，这个信息对于计算机而言并不总是可用的。先前的小谎言 暗示： 

ADO [ BX ], 1 ,增加 BX 所指向的存储单元内的值 

是合法的。可惜存储在 BX 中的值是一个地址，因此没有容易的方法知道目标最是16位还是8 
位。（类似地，我们不知道需要加 0 x 0001 还是0 x 01。）取决于目标的容量，这个语句可以被解 
释/汇编为任何3种不同机器指令之一 • 汇编器（和我们）需要一个提示以便知道如何解释 
[ BXI 。 这也同样适用于直接使用一个具体的存储地址的情况， 如下： 

ADD [4000 h] f 1 ,增加 0 x 4000 存储单元内的值 

有两种方法给计算机一个这样的提示。简单点但是不很有用的方法是在语句中确切解释 
其含义， 4000 h 应该被解释为指向一个16位的字地址，该行® 写成： 

ADO WORD PTR [4_ h ] • 1 , 增加 0 x 4000 存储单元内的值 

与其相对比，使用 BYTE PTR 将 4 000 h 强迫解释成1个8位地址，使用 DWORD PTR (双字）将 
4000 h 强迫解释成1个32位地址。 

一个更加通用的解决方法是提前通知汇编器，告诉汇编器要用一个特殊的存储单元以及 
希望使用的容置。这样一来，这个存储单元的名字可以像直接方式寻址那样被用作该存储位 
置内容 的简略表示。这与高级语言如 Java , C ++ 或者 Pascal 声明变置的作用相似。取决于8088 
汇编语言的版本和生产者，下面的每一条都可行，定义了 16位变 ft (名字由程序员选 择）： 

examplel WORD 1000 ; 1000 

examp 1 e 2 DW 2006 h : 2000 h — 9 x 2000 

现在这些值能以直接寻址方式随意 使用： 

MOV AX , examplel • AX 现在是 1000 

ADD examp 1 e 2, 16 ( exarap 〗 e 2 现在是 2010 h 

CMP AX , example 2 ( AX 大于 example 2 吗？（否） 

这个声明用于几个目的。首先，计算机现在知道两个16位存储单元已经被保留用干程序 
中的数据。其次，程序员已经解除了准确记住这些存储单元的负担，因为程序员可通过有含 
义的名字引用它们。最后，汇编器已经知道它们的容量并且在编写机器代码时知道如何使用 
这些存储单元。这并不是说程序员不能超越汇编器 

exp 1 e 3 WORD 1234 H ,定义 16位空间 

ADD BYTE PTR exple 3 f 1 • 合法但是愚蠢 

但是这很有可能导致程序出现故障。（相比之下，如果你试图访问所存储的数据元素的某 

个部分， JVM 就变得非常恼火并且通常不允许你这样做。） 

汇编器将会接受多种类型的存储器预留，包括一些很大的类型以至于不能在寄存器中轻 

松处理。使用更加现代的语法，下列任一声明都是合法的 定义： 

Tiny BYTE 12 h • 单一字节 

Small WORD 1234 b . 两个字节 
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Medium DWORD 12345678 h 1 四个字节 

Big QWORD 1234567812345678 h 

. 八个字节 

Huge TBYTE 12345678901234567890 H 

« 十个字节 
. (用 TFPU ) 

浮点常数可以用 REAL 4 (对于32位数）、 REAL 8 (对于6 4 位数）或 REAL 10 (对于80位数) 

定义。数值本身通常以正常或者指数形式 表示： 

Sqrt 2 REAL 4 1.4143135 • 实数 

Avogad REAL 8 6.02 BE +23 ,指数表示 

通过用？作为初值，可以定义存储单元而不必初始化。当然，在这种情况下存储器仍将 
包含某种模式，但是无法预料其中的内容，如果你试图使用那个值可能会发生错误。 

6.4.2 字节交换 

存储器中的内容如何与寄存器中的内容进行比较？具体地，如果16位模式0100 1001 1000 
0101保存在 AX 寄存器中，它与保存在存储器中同样的16位模式的值相同吗？ 

出乎意料地，答案是“不相同”（也许它并不是那么让人意外，如果真的那么简单，这本 
书的这一节就不会存在了）。再者，作为一个古老机器的产物，8088具有相当奇特的存储模式。 

人们写数时通常使用所谓的大端 （ big - endian ) 表示 • 所谓的故高有效数（对应最高次方 
的数） 先写（和先存），而小一些的较低有效数跟在后面。快速检査 说明： 通常在纸上写数时 
按大端格式，首先写出的数字意味若基数的锒髙次方。类似地8088 CPU 在寄存器中按大端排 
序存储数值。如上写出的值 (0 x 4985) 将代表十进制值18821。然而，存储器中的数据实际上 
按小端格式逐个字节保存。具有较小地址 (0 x 49.0100 1001) 的字节是最低有效字节，另一个 
字节是最布有效字节。（威廉姆小姐，我七年级的英语老师，坚持认为只有两个字节时不能说 
“烺髙”有效字节，只能用“较高”有效字节。但这种场合下专业术语会战胜传统英语语法。） 
因此，在存储器中这一模式将表示 0 x 8448, 几乎 
两倍大。这一模式也适应更大的数，干是32位的 
设 0 x 12345678 将存储为4个独立的存储器字节， 图 6-4 Ox 12345678的存储，字节交换图示 

如图 6-4 所示。 

幸运的是，程序员几乎不必记住这一点。任何时候数据移入或者移出存储器，字节交换 
都在硬件一级自动完成。除非程序员明确地无视汇编器关于数据大小的认识（如上节），唯独 
变得重要的时候就是处理多组数据，例如数组及其扩展、串或者从一种机器到另外一种机器 
移动数据。（当然，几乎不并不等于决不，当它变得重要时，这可能就是致使你要用头掩墙的 
某类错误的根源。） 

6.4.3 数 组和串 

用于预留单个存储单元的表示也能用来预留大的、多单元的存储块。可以通过用逗号分 
隔的值列表或者简写 DUP 代表的重复值来设 S 存储值。例如， 

Creet BYTE 48 h ,45 h ,4 Ch ,4 Ch ,4 Fh , ASCII ■ HELLO ' 

Thing DWORD 5 DUP 0 x 12345678 , 5 个相同的值 
Empty WORD 10 DUP (?) • 10 个空位 S 

分別定义了 5 个字节的字母 （ H , E , L , L 和 O ) 数组 Greet , —组双字 Thing , 以及具有 10 个 2 
字节数值的数组 Empty , 每个值均未初始化。 

要访问这些数组元素，程序员需要从数组基地址开始索引或者偏移。如果 Greet 中的 H 被 
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存储在 3000 h ， 那么 E 将被存储在 300 Ih ，3002 h 处是第一个 L , O 存储在 3004 h 。 当然，我们不 
知道 Greet 究竟被存储在哪个地址，但是无论它被放在哪里， “ H ” 要比 “ E ” 低一个单元的位 
置。通常，数组名本身指向数组开始值的位覽。因此，要将前三个字母装入 AH , BH 和 CH 
(字节）寄存器，可以使用 

MOV AH, [Greet] . 装人 H 

MOV BH, [Greet + 1] , 装入 E 

MOV CH, [Greet + 2] , 装入 L 

(至少，对于本书）这实际上是一个新的寻址方式，称为索引方式。如前，[ X ]表示“存 
储器 X 单元的内容”，但是在此例中， X 是一个相当复杂的值，计算机需要实时地计算此值。 
由直觉可得 [ Greet 】 与 [ Greet + O 】 以及 Greet 自身相同， 【 Greet +1] 是邻接的字节。由于计算机知道 
Greet 包含字节（由存储器预留声明所定 义）， 它假定 [ Greet +1 1也是一个字节。 

我们怎样访问 Empty 数组 元素？ 第一个元素就是 [ Empty 】， 或者 【 Empty +0】， 或者就是 
Empty 本身。不过在这种情况下，由于 Empty 包含的是 WORD 对象，所以下一个字就不是 
[ Empty + lj 而是旧 mpty +2]! 与大多数高级语言不同，索引的计算自动地考虑了元素的类型， 
8088索引方式寻址需要程序员处理元素空间大小的问题。 

索引方式寻址涉及寄存器更广泛的 用途。 在高级语言中，例如，最常见的数组操作就是 
使用变 ft 索引——如，访问循环内的元素 a [ il , i 是一个整型变量。等价的汇编语言利用一个通 
用寄存器作为索引表达式的一部分。表达式 【 Greet + BX ] 将访问数组 Greet 的第 BX 个元索（如果 
这个字有意义）。通过调整 BX 中的值（假设从0到 4), 表达式 【 Greet + BXj 将依次选择每一个元 
索。类似地，按每次加2调整 BX 中的值，即按字的空间大小，我们可以用下述程序段将整个 
Empty 数组初始化为0: 


BEGIN: 


MOV 

MOV 

MOV 

ADO 

LOOP 


CX , 10 
BX , 0 

[ Empty - fBX ], 0 
BX , 2 
BEGIN 


.Empty 中有 10 个元索 
. 从 [Empty+0] 开始 

. 将这个元索覽 0 
. 移向下一个字 
. 循环，直到 CX-0 退出循环 


只有几个16位寄存器能够合法地用作这类表达式中的索引，8位寄存器都是不合法的。只有 
BX 、 BP 、 S 〖和 DI 寄存器能够使用，而且， BP 寄存器还不能用于该用途，因为这样可能会出 
错。 BP 寄存器已经被操作系统留用，稍后将在 6.4.7 节讨论。 

有经验的 C 和 C ++ 程序员也许已经急于找寻一种快速并且有效的方式了。不用每次经过循 
环时去计算 【 Empt y + BX ], 为什么不将 BX 本身设 S 为 【 Empt y + 0] 所在的位置呢？依此建议得到 
的代码如下： 

. 警告，这行不通！ 


H0V 

CX, 10 

« Empty 中有 10 个元素 

MOV 

BX, Empty 

, 从 [Empty+0] 开始（错误 ! 

MOV 

[BX], 0 

. 将这个元素置 0 

ADO 

BX, 2 

,移向下一个字 

LOOP 

BEGIN 

. 循环，直到 cx=o 退出循环 


尽管这是个好主意，但执行起来就不是那么回事了，主要因为 MOV BX , Empty 并没有按 
我们希望的去做。汇编器将 Empty 视为直接方式寻址的简单字节变置，并且试囝将 Empty 的首 
字节 （“ H ”） 移入 BX 。 这不是我们想要的。事实上，它甚至还不合法，因为我们试图将一个 
单字节移入一个四字节的寄存器中，这会导致空间大小的冲突。要明确地使用一个指针型变 
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量，我们借助关键字 OFFSET 产生存储器地址而不是其内容。 


BEGIN: 


,改进的可行版 

MOV CX, 10 

MOV BX, OFFSET Empty 

MOV [BX]• 0 
ADO BX, 2 
LOOP BEGIN 


.Empty 中有 10 个元素 
« 从 [Empty+0 ] 开始 

. 将这个元素 BO 
. 移向下一个字 
. 循环，直到 CX=0 退出循环 


当然，所得的实际时间/空间改进可能是有限的，因为用于索引的加法仍然由一条单独的 
8088机器指令完成。然而，特别是在紧凑的且经常执行的小循环中，每个小的改进都是有 益的。 


6.4.4 串原语 

如同前面的 Greet 示例，串可以用字符数组实现（通常作为字节，有时也会更大些）。 
8088也提供一些串原语操作指令，这些指令易于快速地执行常用的串功能。这些基本操作都 
要使用 SI ， DI 或者两者同时使用—— SI 和 DI 专门用于优化这些操作。 

现在，我们就集中关注从一个位 K 到另一个位 S 的复制或移动这样的简单任务。依据串 
元紊的基本大小，有两个基本的 操作 ： MOVSB (移 动字节串）和 MOVSW (移动字串）。这 
种基于串元素基本大小的划分适于所有串原语操作指令，这里还有两点不同就是分别以 B 和 W 
结尾。因此，为了简化解释，我们将相似的操作行为归结为 MOVS ? 名下。 

MOVS ? 操作将数据从 [ SI 】 复制到 [ D 【】 # 这个操作本身只复制单独一个元素，但是很容易 
将其放到一个简单的循坏体内。串原语操作的优点是 CPU 在机器指令中支持自动循环，在汇 
编语言级用一个前缀助记符来表达。最简单的例子就是用 REP 前缀， 例如： 

REP MOVSB 

这一行为很像 LOOP ? 指令，在此 CX 寄存器被当作计数器。每次指令执行时， SI 和 DI 的 
值都要调整， CX 的值递滅，指令反复地执行直到 CX 降为^ 

有两种调整 SI 和 DI 的方式。首先，自动更新的幅度与 MOVS ? 指令中所指元素的大小相 
对应， S 1/ DI 的改变幅度对于字节指令是1,而对于字指令是2。其次，标志寄存器中的一个特 
殊标志（方向标志）控制地址从低到高（增大 SI / DI ) 或者从高到低（减小 SI / DI )。 这个标志 
有两条指令控制，如表 6-2 所示。 


表 6-2 基本串的方向标志搡作 


指今 

标忐状态 

SI/D 〖 操作 

地址序列 

CLD 

淸零 (=0) 

加 

低到商 

STD 

SI (=1) 

减 

高到低 


要明白这是如何工作的，我们来设置两个数组，并在它们之间进行复制。 

Arrl WORD 100 DUP (-1) • 源 数组： 100 个字 

Arr2 WORD 100 DUP (?), 目的 数组： 也 蛏 100 个字 


MOV 

MOV 

CLD 


SI, OFFSET Arrl 
DI, OFFSET Arr2 


MOV 

REP 


CX, 100 
MOVSW 


, 设霣 源地址 
. 设 B 目的地址 
. 清零方向标志 
, 从 Arrl[0] 到 Arrl[99] 
. 循坏处理 99 个字 
,进行拷贝 


另外一个常见的操作就是比较两个串是否相等。这可用 CMPS ? 操作完成，该操作隐含执 
行从源操作数减去目的操作数。重要的安全 提示： 该操作是 CMP 指令的相反过程， CMP 是从 
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目的减去源！更重要地，该指令通过设置标志位使得正常的无符号条件跳转将完成应该做的 
事情。 

REP 前缀的另一个变形在这样的背景下特别有用。只要 CX 不为0并且零标志被置位 REPZ 
(或者 REPE ) 就循环执行。这实际上意味着“还没有到达串的结尾并且到目前为止两个串是 
相同的”，因为零标志仅当减法的结果是0时才置位，这意味着这两个字符是相同的。利用下 
面的代码段我们能够进行串的 比较： 


MOV 

MOV 

CLD 

MOV 

REPE 


SI, OFFSET Astring 
DI, OFFSET Bstring 

CX, 100 
CMPSW 


* 设 S 源地址 
. 设 w 目的地址 
I 清零方向輙志 
. 循环 100 次 
. 比较 


这段代码执行后会有两种可能发生。一种可 能是： CX 变为0且 Z 标志 置位， 这种情况下两 
个字串相同。因此，语句 

3E STRINGSEQUAL i 串相等 

能转移到相应的代码段。 

另一种可能是，两个元素比较时 Z 标志淸零，说明两个元素不相同。差值的详细结果 （SI 
中的字节比 DI 中的大还是小）保存在标志寄存器中，如同 CMP 操作的结果。通过用 JB , JA , 
JAE 等检査其他的标志，我们能够判断出究竞是源 （ S 1) 还是目的 （ DI ) 寄存器指向较小的串。 
主要的困难在于留在 SI 和 DI 寄存器的地址指向了错误的位 S 。 具体地说 ， SI ( DI ) 中的值已 
经越过了比较的串位置一或者说刚好在串结尾的下一个位置。 

3B SOURCESMALLER . SI 指向的胡小 

, 如乘到达此处 ， DKSI 


第三个有用的操作是从一个串中寻找某个值的出现（或者不出现）。（例如，一个包含浮 
点数的串将会有’字符，否则，将是一个整 数。） 这由 SACS ? ( SCAn 串）指令实现。不 
同于先前的指令，这类指令只处理一个串，因此用一个索引寄存器 （ DI )。 该指令将累加器 
( AL 或 AX ， 取决于数据的大小）中的值与串的每个元素进行比较，设罝标志并且适时地更新 
DI 。 同样，如果使用 REP ? 就会在 CX 为0到达串的结尾或者 Z 标志变为正确的值时停止，无论 
哪种情况最后的 DI 都是指向所感兴趣位 K 的邻近下一个位 

使用 REPZ 前缀，我们能够跳过一个串开头和结尾处的空格。假设 Astring 包含一个100字 
节的数组，其中一些（在开头或结尾）是空格字符 （ ASCII 值是32)。要找出第一个非空字符 
所在的位置，我们可以使用下面的代 码段： 


MOV DI,Astring , 栽人串 

MOV AL, 32 . 向累加器栽人空格字节 

MOV CX, 100 , Astring 串中有 100 个字符 

CLD I 堉零方 向标志 

REPE SCASB « 扫描不匹 fc 

JE ALLBLANKS , 如果 Z 标志置位，没有发現不匹 K 

, 否則， DI 指向了第一个非空格字符后的一个字节 

DEC DI . 恢复 DI , 指向第一个非空格字符 

要跳过尾部的空格，我们只要从末 尾开始 （即 Astring +99) 并设置方向标志以便从右向左 
进行串的操作 



STD 


DI 


Astring 


DI, 99 
AL. 32 
CX, 100 


莪人串 

跳至串尾 
向累加器栽入空格 
Astring 串中有 100 个字符 
方向标志置 1 
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REPE SCASB * 扫描不匹配 

3E ALLBLANKS , 如果 Z 标忐罝位，没有发现不匹配 

. 否则， DI 指向了第一个非空格字符后的一个字节 

INC 01 » 恢复 DI ， 指向第一个非空格字符 


类似的前缀 ， REPNZ (或 REPNE )， 只要 Z 标志未置位，也就是说只要元素不相同，指令 
就会反复执行。因此，要在串中找出第一个’ （ ASCII 值44)，我们对第一段程序略做 修改： 


DI.Astring 
AL, 44 
CX, 100 


MOV 
MOV 
CLD 

REPNE SCASB 
JNE NOPERIOO 

I 否則， DI 指向了第一个 

DEC DI 


. 栽人串 

. 向累加器教入字节 ’ 

.Astring 串中有 100 个字符 
. 请零方向标志 
. 扫描匹 fc 

. 如果 Z 标志清零，没有发 现匹配 
字符后的一个字节 

* 恢复 DI, 指向第一个’字符 


最后一个常用的串原语就是将某个值反复地复制到一 个串。 例如，这可用于数组快速淸 
零 。 STOS (存入串）将累加器的值复制到指定串。要将先前定义的空白数组存入全0,可以 
使用以下 代码： 


MOV DI, Empty 

MOV CX, 10 

MOV AX, 0 

REP STOSD 


. 口标串 

. 要存储 10 个元索 
. 要存人的值是 0 


遗憾的是，这是8088对用户定义派生类型的唯一支持。例如，如果程序员想用多维数组， 
程序员就必须自己想好如何规划存储布局。类似地，一个结构或者记录只能用邻近存储单元 
表示，对于面向对象的编程没有提供支持。这必须通过髙层的汇编器和/或编译器解决。 


6.4.5 局部变 置和倌息隐藏 

目前所定义的存储器组织有一个问题就是每个存储单元都隐含地定义用于整个计算机。 
采用高级语言编程常用的术语来讲，就是我们看到的每一个变 妖都是 全局的——意味矜能从 
程序中任何地方去访问或者修改（先前定义的） Greet 数组。这也意味着整个程序只能有一个 
变最命名为 Greet 。 比较好的编程习惯提倡使用局部变 i ,它具有私密、安全以及《用名称的 
能力。类似地，正如 JVM 中讨论的，只有跳转指令限制了程序员重用代码的能力。 


6.4.6 系统找 

JVM 和 808 S 两者都支持子例程（子程序），如同 JVM 的 Jsr 指令，8088提供 CALL 指令与 
硬件栈配合。该指令将程序指针 （ IP ) 的当前值压入栈并且从转移参数所指的位置开始执行。 
对应的 RET 指令弹出栈顶值，将其装入指令指针，从保存的位置继续执行， 

8088认定标准的 PUSH 和 POP 指令从机器栈移入/移出数据。例如，良好的编程习惯提倡不 
要破坏子程序中寄存器的内容，因为无法确定调用环境不再需要该数据。确保这不会发生的 
最简方式就是在子程序开始处保存 ( PUSH ) 这些寄存器并在结束的时候恢复 ( POP ) 它们。 
PUSH 和 POP 指令均接受寄存器或存储器地址参数 ， PUSH AX 和 PUSH SomeLocn 都是合法的。 
要压入一个常数值，应该首先将其栽入存储器或者寄存器一当然，栈内容弹出到一个常数中 
就没有意义了。 

多数汇编器不鼓励子程序调用和跳转语句使用同一个标签，尽管 CPU 并不关心这一点。 
(毕竟，这些标签只是加到程序 II •数器中的数值！）然而，如果对此没有认真处理，程序员将 
会违反栈规则，要么将多余的东西留在栈中（导致栈充满进而产生溢出错误），要么从一个空 
栈中弹出并使用垃圾内容。也就是说，不要这样去做。由于这一原因，8088汇编语言中的子 



程序与我们已经见过的标签有些 不同： 

MyProc PROC 

PUSH CX 

, 聪明地做些事情 
MOV CX, 10 
MyLabel : 

. 在 10 次循环内做些聪明的寧情 
LOOP MyLabel 
POP CX 
RET 

HyProc ENOP 


将 CX 压人栈中保存 


恢复 CX 


这里有几点需要注意。首先，为了帮助程序员和汇编器跟踪差异，标签 MyProc 的声明有 
別于标签 MyLabel (例如，没有冒号）。第二，例程用 PROC / ENDP 开头和结尾。这些不是助 
记符，只是汇编制导，它们并不会翻译为机器指令。它们只 是帮助 程序员和汇编器组织程序。 
最后一条机器指令是 RET ， 这是子程序需要的。第三， CX 寄存器用于子程序内部循环的索引， 
因为值被压入栈顶并且在子程序结尾处弹出，所以调用环境看不到 CX 中的任何变化。从其他 
例程调用这个例程是合法的，调用 如下： 


Other PROC 


LoopTop 


CALL 


LOOP 

RET 

Other ENDP 


CX. 50 


MyProc 

LoopTop 


闲用 MyProc 50 次 

执行 MyProc 子例程 
在循环中 （ 50 次） 


Other 过程使用同样的循环结构，包括 CX , 调用 MyProc 50次，但是由于 CX 寄存器被保护 
了，所以不会出错误。当然， Other 过程自身使用 CX 寄存器，所以调用 Other 必须注意。（更好 
的 Other 版本一专业程序员期待的一会在使用前先利用 PUSH / POP 指令对其做类似的保护。） 

6.4.7 栈帧 

除了提供临时存储的寄存器，存储器中的栈也可以用于临时存储局部变量。要理解这是 

如何工作的，我们首先看栈本身怎样工作（图6-5)。 

8088的一个通用寄存器 SP 保留给 CPU 和操作系统用来 ° xr，FFr； 

保存机器栈顶当前的位置。在任何程序的开始， SP 的值被 

设置为 斿近主存顶端的某个位8_主存相对髙地址的部 

分，而程序本身被保存在较低的位置。在程序和栈顶之间 —— — 

是大片的未用空闲存储区。 -_ [SP1 

一旦数据被放人栈中（一般由 PUSH 或者 CALL ), SP • " — ~ 

^ J 找 

寄存器就减去一个适当的曼，通常是2。这将栈顶又向程 - 

序部分推进了2个字节。压入的值就保存在这2个字节中。 

另一个 PUSH 会使 SP 再降2个字节并保存另外的数据。与直 
觉正好相反，这意味着栈“顶”实际上是栈的最低（最小） 

地址部分。当数据从栈弹出时， [ SP ] 处的值被复制到变量 0x00000 

中 I 然后 SP 加2,设置为新的“栈顶”。（这也适于执行 

RET 并且从栈中弹出原有的程序计数器内容。） 图 6 _ 5 CP u 栈（简化） 

然而，栈也是保存局部变最的理想位置，每次程序被 
调用，就会产生新的栈顶。事实上，程序需要的任何局部信息，如函数参量、局部变量、保 


ISP+2] 


[SP-2J 


0x00000 


图 6-5 CPU 栈（简化) 
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存的寄存器内容以及数据都能放入栈内。既然这是一个常见任务，特别是在高级语言中，就 


有一个标准方式组织栈以便不同复杂程度的程序能够 
协调运行。 

这一基本思想称为栈帧（图6-6)。正如通常所实 
现的，它包含两个寄存器， SP 和 BP 。 这就是为什么 
程序员不应该乱用 BP 寄存器进行一般索引的原因 •因 
为 BP 已经用于栈帧。但是因为 BP 作为索引寄存器， 
所以 MOV AX , [ BP +4| 这类的表示是合法的并且能用 
来访问靠近 BP 的存储单元。 

有了以上认识，栈帧如下（从存储器顶部开始， 
或者从栈“底”开 始）： 

•过程子程序的任何参量 

•返回地址 

• BP 原有的值（由 BP 指向） 


程序参 S 
程序参进 
程序参 ft 


返网地址 
BP $ 存器原来内容 


为局部变 fi 
保留的空间 


保存寄#器内容 


—IBP 】 现在指向这串 . 


—ISP 】 现在指向这里 


•保存局部变量的空间（由 SP 指示顶端) 
•保存的寄存器内容 


图 6-6 — 个 8086 栈帧 


这是如何工作的？我们下面使用一个有些复杂的 例子： 我想要编写一个等价于 furthers ) 
函数或方法的汇编语言代码， furthers ) 采用了两个参量并且返回了一个大于零的绝对值。用 
Java 编写的这个方法如图 6-7 所示 • 用 C / C ++ 编写的如图 6-8 所示。 


public static int further(1nt x, int y) 


int further(int x, int y) 

{ 


{ 

int 1,j; 


Int i,j; 

i ■ x; 


i - x; 

if (i < 0) 


if (x < 0) 

i - -x; 


1 - -x ； 

j - y ； 


j ■ y: 

if Cy < 0) 


if (y < o) 

j ■ -y: 


j - -y; 

if Cl < j) 


if a < j) 

i - j; 


i - j; 

return 1; 

} 


return ii 

> 


图 6-7 Java 函数 further(int X ， int y) 


图 6-8 C/C++ 函数 further(int x, int y) 


代码本身很简单*假设我们将数据移入 AX 和 BX , 就能简单地比较这两个数，如果 BX 大， 
就将其移入 AX 。 类似地，将函数的参数 （ x 和 y ) 与0比较，我们可以对局部变量使用 NEG 指 
令也可以不用 NEG 。 然而，要正确地访问它们，我们需要足够的栈空间保存这些局部变量。 

下面的代码将很好地解决这个 问题： 


Further PROC 

PUSH BP 



MOV 

MOV 



JCE 


AX,[BP+2] 
[SP+2], AX 
[SP+2],0 
Ski pi 


. 保存原有 BP 

. BP 现在指向 SP 内容 

, 留出两个 16 位局部变 ft 空间 

. 保存 BX 

. 获取第一个 参:& 

. 保存在第一个局部变 * 位 5 
. 与 0相比 
* 如果 >*0 就不求反 





Skip2: 


Skip3: 


AX,[BP+4] 
[SP+4], AX 
CSP+4]. 0 
Sk1p2 
[SP+4] 

AX, [SP+2] 
BX, [SP+4] 
AX, BX 
Sk1p3 
BX, AX 


POP 

RET 

Further ENOP 


, 获取第二个参董 
, 保存在第二个局郎变 fi 位置 
, 与 0 相比 
, 如果 >=0 就不求反 
, 否則，求反 

« 栽人第一个局部变 s 
, 栽人第二个局部变 a 
. 如果第一个 呙部变 第二个 W 部变电 
,那么不做调整 
. 否則，求反 
. 答案现在 AX 中 

. 恢复原来 BX 的值 
. 销 S 局部变《 

. 恢复原来 BP 的值 
,仍然需矣弹出参《: 


图6_9展示了这个程序构建的栈帧。特别注意传入的两个参董以及原有寄存器值被保存的 
位置。最后，有两个存储器字与局部变量 i 和 j 对应。在程序结尾处栈最终以相反的次序解构。 
为什么我们不保存并恢复 AX 中的值？因为 AX 寄存器被用于保持返回值，因此它的原有内容 
不得不被 覆盖。 

这是如何工作的？我们将使用一个有些复杂的 例子： 我想编写一个与函数 further (-100, 
50) (它将返回 100) 等价的汇编语言程序。为了调用这个程序，调用函数必须首先将两个整 
数压入栈，然后还必须找到一种方法在函数返回后撤销这两个值。完成这个任务的简易方法 
如以下代码所示： 


X 

DW -100 

, 第一 个变敏 

Y 

DW 50 

. 第二个变 ft 

PUSH 

X 

. 压入 x 

PUSH 

Y 

, 压入 Y 

CALL 

FURTHER 


i 此时 AX 包禽值 100 

ADO SP, 4 

,从栈中移出 X, Y 


.AX 仍然包含诮 100 

所构建的整个栈帧如图&9所示。 


_|BP 】 現在指向这里 

— [SP 】 現在指向这里 

图 6-9 furlher(X ， Y ) 的栈帧 

6.5 再论锥形山 

作为一个展现8088如何进行算术运算的有效示例，让我们来分析先前给出的山体体积问 



NEG [SP+2] « 否則，求反 

Ski pi: 


llCMPf iCMPJCEl 
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题。如第2章所述，原问题描述 如下： 

底部呈圆形、直径 450 m 、 并且髙 150 m 的山体体积是多少？ 

因为答案中涉及使用: t ， 所以至少计算部分应该在浮点运算单元 FPU 中完成。我们假设 
(为了淸楚起见）名称/标识符 “ STORAGE ” 指示一个16位的存储单元（与 6.4.1 节中一样，这 
可以是某处的全局变最或者是栈中的局部变量），并且我们可以使用这个单元将数据移入/移 
出 FPU 。 为了简单起见，我们使用16位整数以及寄存器进行计算。假设（为了清楚起见）完 
成整型计算：因为涉及的数不是很大，这不会出现问题. 

首先，我们计算 半径： 

MOV AX, 450 I 直径 MSOm 

MOV BX, 2 ; can't divide by a constant 

DIV BX i AX=450/2, DX 仍为 0 

底部的面积是半径的平方乘以 Jl , 为了使用 Jl , 我们必须初始化 FPU , 并且在此进行运算。 


MUL 

FINIT 

MOV 

FILD 

FLDPI 

FMUL 


STORAGE. AX 
STORAGE 


.AX 中保存半径 
• AX 乎方，结果为 DX: AX 
. 初始化 FPU 

. 将聿径的平方（作为整数）移人存储器 
. 移入 FPU 

. 教入 p1=3.1415... 

. 计算底的面积 


此时，我们可以将底的面积从 FPU 移至 ALU , 但是这样做之后，我们会丢掉小数点右面 
的部分（即损失精 度）。 更好的方案就是继续在 FPU 中计算，用存储单元 STORAGE 作为整型 
数据的临时单元。 艰申要点： 圆锥体积是相应圆柱体积的三分之一，而圆拄体积等于底的面 
积（已经算出）乘以高 （150 m )。 因此，最后的计算过程如下： 


MOV 

STORAGE, 150 

. 将布度我人 FPU 

FILD 

STORAGE 


FMUL 


. 阏柱体枳 * 成的面枳 x 高 

MOV 

FILD 

STORAGE, 3 

STORAGE 

I 将 3 移人 FPU 用干除法 

FDIV 


. 除以 3 ,求阀锥体积 


结果现在 fpu 栈 m 


FISTP STORAGE , *P* 窻味着运算执行后掸出栈（保 存 ) 

, STORAGE 现在包 含轻终 结果，舍人 为整数 

^ 11 * 在 ALU 进行操作之前等待 FPU 完成 


6.6 接口问题 

前面例中的代码是汇编语言程序与外界接口的一种方式^这些栈帧也允许髙级语言生成 
的代码（有些微小的变化，需注意）来操纵。因此，如果你有一个大型的 Pascal 或者 C ++ 程序, 
可以用汇编语言编写一小部分（一个或几个函数）以确定你可以完全控制整个机器——例如 
获取游戏动画效果的额外的加速。 

尽管多数人考虑到接口时通常认为是与设备或者外设的接口。例如，我如何将来自键盘 
(用户从这里键入）的数据送至 CPU , 然后送至屏幕（数据在此显示）？可惜答 案是： “这要 
看具体情况”。 

事实上，这取决于很多事情，你使用的设备类型，你所用的机器种类，以及你正在运行 
的操作系统的类型。实际上，任何操作系统 （ Windows , Linux t MacOS ， FreeBSD , 等）都 
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是一种特殊的计算机程序，它始终都在运行并且介入在系统上的其他程序与硬件设备之间。 
操作系统提供并且控制对输人输出设备的访问一这意味着如果你想要同设备打交道，必须 
调用相应的函数（由操作系统提 供）， 并借助于在栈中设置正确的参量以及在合适的位置发出 
CALL。 这些函数的细节因系统而有不同。 Linux 系统采用一种方式工作，使用一组函数。 
Microsoft Windows 做同样的事情却使用一组不同函数，它需要不同的参量及调用。因此，要 
与多数标准设备交互，秘密在于理解你的操作系统如何处理它，然后使用与操作系统的神奇 
“握手”，让操作系统去完成你想要做的事。 

有其他两个主要方法与设备接口。一些设备，如视频控制器，可以直接归属到计算机存 
储器上并且当相应的存储内容改变时就自动地更新。显然这个存储区对干其他的用途（比如 
存储程序〉是不可用的。在最初的 PC 上（运行 MS-DOS), 例如，“视频存储器” （VRAM) 起 
始于 OxAOOOO, 这意味着程序不能使用超出 0x9FFFF 的空间。然而，这也意味着一个聪明的程 
序通过将合适的数据放在合适的超出 OxAOOOO 的位置上就能在屏幕上显示该数据。这个技术， 
称为存储器 I/O 映射，可以很容易地实现，例如，将 ES 段寄存器设置为 OxAOOO , 然后使用寄 
存器对如 ES: AX 而不用更-•般的 DS: AX 作为 MOV 指令的目标变餐^ 

其他设备通信方式是通过不同的端口（如串口， UDP 端口等）。这通常称为端口 I/O 映射。 
每个这样的端口（以及其内部不同的数值，如视频色彩）都可用一个16位的端口标识号进行 
独立寻址。 OUT 指令有两个参置，一个16位端口和一个8位数据值，仅将数据值传到端口就可 
将该数据送至附加在该端口的设备中。设备对该数据的处理是它自己的亊。 IN 指令将从指定 
的端口读出一个字节的数据。显然，这种类型的编程需要非常了解端口编号体制以及数据类 
型和含义。但是有了这种控制，如果你要用，你就可以将你的壁挂鱼缸钩到8088的打印端口， 
不是用于打印，而是自动控制鱼缸的温度和换气。 

6.7 本章回顾 


•Intel 8088是系列芯片的先驱。特别是，作为嵌初 1BM-PC 内部的芯片，8088很快就成为商用 
桌面机的最常用芯片，并且确立了 IBM 和 Microsoft 作为20世纪大部分期间的工业霸主地位。 

• 8088 是 CISC 芯片设计的经典案例， CISC 芯片拥有庞大、丰富的指令集。 

• 8088 有8个16位的寄存器，被命名为“通用”寄存器（尽管这些寄存器中许多都有特殊 
的用途以及一些小的8位寄存器，这些8位寄存器在物理上是16位寄存器的一部分， 
还有逻辑上（以及物理上）分开的浮点单元 FPU 

•大多数汇编语言操作采用两变量形式，操作助记符后面跟目的变量和源变设， 如下： 

OP dest,src ; dest ■ dest OP src 

• 可用的操作包括通常的算术运算（尽管乘法和除法有特殊的格式并且使用特殊寄存器）、 
数据传送、逻辑运算，以及若干其他特殊用途的操作功能。 

• 8088 支持多种寻址方式，包括立即方式、直接方式、间接方式和变址方式。 

•浮点操作在 FPU 中进行，使用基于栈的标志和一组特殊的操作（大部分以字母 F 开头）。 

•8088 支持标准的分支转移指令，也支持特殊的循环指令，使用 CX 寄存器作为循环计数器。 

• 8088在存储器中保存数据的格式与在寄存器中保存数据的格式不同，这会使编程新手感 
到困惑。 

• 数组和串使用邻接存储单元实现；也有特殊用途的串原语操作用于常用的串/数组操作。 

• SP 和 BP 寄存器通常用来支持具有标准栈帧的标准化机器栈，这使得汇编语言代码与髙 
级语言代码的结合很容易。 
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6.8 习题 

1. “系列芯片”的含义是什么？ 

2. 为什么8088有固定数量的寄存器？ 

3. BX 和 BL 寄存器之间的差别是什么？ 

4. 下面的段 :偏移 所对应的实际地址是什么？ 

a . 0000:0000 

b . ABCD :0000 

c . A 000: BCD 0 

d . ABCD :1234 

5. 在 JVM 中没有的 CISC 指令的实例？ 

6. 乘法指令和加法指令有何区别？ 

7. JA 和 JG 之间的区别是什么？ 

8. ADD WORD PTR [4000 h ], 1 和 ADD BYTE PTR [4000 h ], 1 之间有何不同？ 

9. 8088 在使用 16 位 UNICODE 量表示字符的语言（如 Java ) 中如何处理串操作？ 

10. 8088程序中所谓的全局变盘是如何保存？ 

11. 子程序的参数以自左至右还是自右至左的次序进栈对于8088有影响吗？ 


第 7 章 Power 体系结构 


7.1 背景 

对基于 Intel 芯片设计的用于台式机的 CPU 而言，唯一最大的竞争者可能就是 Power 体系结 
构。直到2005年中期， PowerPC 芯片一直用在 Apple Macintosh 计算机中。尽管 Apple 已经转向 
了基于 Intel 的芯片， Power 体系结构仍然在许多应用领域中起主导作用。截至2005年11月，世 
界上20个最快的超级计算机中半数使用基于 Power 的芯片，三个主要的游戏平台 ( Sony , 
Microsoft 和 Nintendo ) 到2006年底全都计划采用 Power 芯片实现控制台。在嵌入式系统中， 
2006个汽车模型中约有一半使用基于 Power 的微控制器（由 Freestyle 生产）。 

如果说 Pentium 是复杂指令计算 CISC 体系结构的权威示例， Power 芯片就是精简指令集计 
算 RISC 体系结构的教科书版本。 

从历史的角度， Power 体系结构创始于1991年 Apple 、 IBM 和 Motorola 的联合设计项目。 
(注意 Intel 不是这个联盟的成员。要知道 Intel 由于基于 CISC 的 x 86 系列已经占据了统治市场地 
位，因此何必参加这个联盟？） RISC 由 IBM —直在嵌入式系统（见第9章）中使用了近20年， 
被认为是一种从相对较小的（因此廉价的）芯片获取高性能的方式。 

RISC 计算的关键在于（如同生活中的很多亊）计算机程序花贽大部分时间去做一些相对 
常用的操作。例如，研究表明在一个典型的程序中大约20%的指令就是 load / store 指令，即数 
据在主存和 CPU 之间的移动。如果工程师能够加倍这些指令的操作速度，那么他们就能获得 
系统整体性能10%的改进！所以，不是花时间和精力去设计执行复杂任务的硬件，他们的任 
务是设计执行简单任务的硬件，以使任务执行的性能好、速度快，另一个极端是，增加不常 
使用的寻址方式会降低每条指令的执行性能，因为计算机必须检査每一条指令来看该指令是 
否使用了这种寻址方式，这偌要更多的时间或者昂贵的电路系统。 

一个典型的 RISC 芯片体系结构通常有两个特别的方面可加速（并 简化） 计算。第一，指 
令本身通常是固定长度（对千 PowerPC , 所有指令都是 4 个字节长度《对于 Pemium ， 指令长 
度可变，在1 〜 15字节之间）。这对于 CPU 取指令部分可以完成得更容易并且更快，因为它不需 
要花时间考虑究竞取多少字节。类似地，二进制模式的译码以决定执行什么操作也能完成得 
更快并且更简单。最终，每条指令都足够的简单从而可以快速地执行（通常在它取下一条指 
令的时间里执行完成——单周期）。 

RISC 体系结构的第二个优点与指令组有关。它不仅能很快地执行每一条指令，而且指令 
集中的指令数量少，这意味着在如何进行给定的（高 级） 计算问题上通常没有大量的近义变 
形。这使得优化的编译器能很容易地分析代码。更好的分析可以产生更快的程序，即便单个 
的指令并没有加速。 

当然， RISC 体系结构如 Power 不足的一面就是大部分功能强大的操作（例如，第6章描述 
的串处理系统）不作为单独的指令存在，必须用软件来实现。甚至许多存储器访问指令和方 
式也不可用。 

Power 联盟的设计目标之一就是不仅开发有用的芯片，也要开发交叉兼容的芯片。当然， 
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她細 M 已经建立了良好的独自设计的芯片系列 （例 如， IB _ RS/ _ 0：S 片以及 

turn 挪）。■槪达麟种顧， pgw 吨赌賴_的辦可贼互操作， 
对于未来技术的改进也提前进行了设计。蝴 80x86/P e mium 系列， Power 是芯 片系列 （包括 
PowerPC 子系列）一但是与 80x86/Pentium 不同的是， Power 设计提前考虑了可扩展性 

Power 对灵活性方面的关注已经带来了奇特的效果。首先，与㈣系列不同，开发^焦点 
的〜更 3机器。 从一开始 ，低端桌面甚至嵌人式系统控制器就已经是目标市场 
r 。(这-市场优势应该是明 E 的：如果你的桌面1作站与你的烤箱制造厂所用的控 
片1嶋兼容，编写和_该烤箱的控雛件就很容易。因此， 1BM 不仅_出更多烤箱 
^器芯片，还_出更多I作站。） 与此剛 •， 该联断 ■终扩展卿位麵（现在典型 
代表是 PowerPC G 5 ) 并且定义- 个最初 （32 位）设计的扩展指令集来处理64位的; ft。 此外， 
PowerPC 在数据存储格式方面提供了大釐变形，这在下面将会看到。 

7.2 组织和体系结构 


正如大多数现代计算机，为了支持多任务， PowerPC 系统至少有两个不同的视角（形式 
也娜作網 财)。 其基本思雜賴户级程序只具备細的嫌能访问 
计算机的一部分资源，而相当一部分计算机资源超出了用户级程序的访问权限，除非程序 
(典型的是操作系统）运行在超级用户的特 权下。 （8088 的不安全性就是由于缺少这样明确的 
编程模型。）这可防止用户程序彼此干涉或者妨碍关键的系统 资源。 本章的讨论将主要关 ft 用 
户模型，因为这是与日常编程任务最相关的。 

7.2.1 中央处理单元 

通过图 7 -1 可以了解 Power 体系结构 CPU 的大部分特征。有一组“通用寄存器”，数量为32 
个（相对较多），在早期的 PowerPC 型号如601 (直到 G4) 中是32位宽，而在 G5 和970中是64 
位宽。外部还有32个浮点寄存器，其宽为64位。 ALU 和 FPU 两者都有状态/控制寄存器 （CR 和 
FPSCR)， 并且 有几个（相对 较少） ： S： 片料的专職存 gg, 你可能不需翻它们来保持 
PowerPC 系列之间的兼容性。或者至少这就是要告诉给用户的❶ 



至主存 


图 7-1 PowerPC CPU 体系结构方框图 
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实际的物理布局更加复杂一些，因为有些专用硬件只有超级用户（也就是操作系统）可 
以使用。例如，有一个机器状态寄存器 （ MSR ) 保存系统方面的超级用户级别的重要信息。 
(这类信息的一个例子是系统当前运行在用户级还是超级用户级，也许是由外部设备产生的响 
应超级用户级事件。另外一个系统方面信息的例子是存储器存储格式是采用大端 （ big - endian ) 
还是小端 ( little - endian ) 格式，后面会讨论。）将当前的计算状态（保存在 CR 和 FPSCR 中〉 
与整个机器状态分开可以使多任务环境对于突发变化的响应更容易一些，不会中断当前的计 
算。一个更加微妙的优点就是 CPU 芯片设计者能够复制 CR 和 FPSCR 并允许几个不同的用户级 
程序同时运行，每个程序使用它自己的寄存器组。这个过程在理论上可以应用到整个用户级 
寄存器空间。特别地 ， PowerPC G 5 复制了整型和浮点处理硬件，允许来自于最多4个进程的 
多达4条指令完全并行执行。 

用户与超级用户对 CPU 芯片视图的另一个关键区别是关于存储器访问。操作系统必须能 
访问（并且真正控制）计算机全部可用的存储器，出于安全的理由用户级程序通常被限制在 
它自己的空间里。 PowerPC 有一组固定的寄存器用于在硬件级别上管理存储器访问，但是只 
有超级用户能够访问这些寄存器。下一节将描述这个功能。 

7.2.2 存储器 
存 储管理 

在用户级， PowerPC 存储器组织简单（比8088简单得多）。每个用户程序都拥有32位地址 
空间，在理论上可访问2«个不同的一维存储单元。（当然，对于64位版本的 PowerPC 存在2^个 
不同的地址/单元。）这些单元定义了程序可用的逻辑存储器。它们要么用作直接地址（如先 
前所定义）要么用作逻辑地址，逻辑地址由存储管理硬件进行转换。此外， PowerPC 定义了 
第3种用来快速访问指定的存储区域的访问方法。 

块地址转換 

如果一个特別的存储器块需要经常（而且快速地）被访问， CPU 有一组专用寄存器，块 
地址转换 ( BAT ) 寄存器，用来定义物理存储器的特殊块，可以用于执行类似的査找任务但 
只要很少的步骤。 BAT 寄存器最常用于代表髙速数据传输的存储区域，例如图形设备和其他 
类似的 I / O 设备。如果一个逻辑地址与 BAT 寄存器标记的存储区对应，那么就跳过虚拟存储过 
程，进而从 BAT 寄存器直接读出对应的物理地址。 
cache 访问 

存储器访问的最后阶段与如何完成访问无关，而是要决定所需的内存位霓之前（近来） 
是否已经访问过，或者吏精确地，所需的数据是否保存在 CPU 内部的 cache 中。因为片内存储 
器的访问要比片外主存的访问快很多，如同大多数现代处理器芯片， PowerPC 将近期使用的 
数据拷贝在一个很小但速度很快的存储器中。 . 

7.2.3 设备和外设 

先前定义的存储管理系统的另一特征就是访问 I / O 设备能在存储管理系统中容易地处理。 
利用 BAT 寄 存器访 问高速 I / O 设备已经提到过。类似的方法 （ I / O 控制器接口 转换） 能够完成虚 
拟存储系统内类似的存储器地址任务。每个段寄存器包含信息以及 VSID 。 这里的信息域详细 
指出该逻辑地址是否指向某个外设。如果是，就跳过页转换，并且该逻辑地址用来产生指令 
和地址序列来处理适当的设备。这使得 PowerPC 对于设备访问和存储器访问同样容易（实际 
上就像存储器访问），只要操作系统在段寄存器中正确地设置了数值。 
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7.3 汇编语言 

7.3.1 算术运算 

PowerPC 汇编语言与我们已经看到的系统有两个明显的不同。第一，尽管 PowerPC 有一个 
寄存器组（如同 x 86 和 Pentium )， 但是寄存器采用编号而不是名字。第二， Power 体系结构指 
令拥有独特的3参量格式。将两个数相加的指令可 写为： 
add r3.r2.rl # 寄存器 3 = 寄存器 2 + 寄存器 1 

注意第2和第3个参量（寄存器2和 1) 在计算中保持不变（这有別于我们已学过的其他 
CPU )， 因此可以在后来被重用。当然，通过参 S 的重复，我们能得到更传统的操作，例如: 
add r2.r2.rl # 等价于 x86 的 ADD R2, R1 

一般地，二进制操作 （算 术，逻辑，甚至比较）会以这种方式表示。这种3参量格式，结 

合相对较多的可用寄存器，在进行计算和保存中间结果方面给程序员和编译器带来了巨大的灵 

活性。它也给予计算机一定的余地重新按需动态地组织计算 • 如果你考虑下面的指令序列 

add r3.r2.rl # ⑴寄存 253 = 寄存器 2 + 寄存器 1 

add r6,rS,r4 # (2 ) 与上面的类似 

add r9.r8.r7 # (3) 

add rl2,rll,rl0 # (4) 

add rl5,rl4,rl3 # (5) 

add rl8 t rl7,rl6 # (6) 

没有理由要求计算机一定按上述次序执行，有足够能力的计算机甚至能够同时执行这些 
指令。 

一个更 加有趣的问®是为什么 Powei •体系结构以这种3参量的方式工作。一个简单的回答 

是， “ 因为它能够' 在设计上， PowerPC 对每条指令都采用统一的并且相当大的位数 一 32 

位。由于有32个寄存器，指令用5位指定任一给定的寄存器，所以指明3个寄存器就要占用32 

位中的15位，这还意味着可以有2 17 (大约 128000) 个不同的3参最指令可用。显然，这已经超 

出任何神志正常的工程师的设计期待——但工程师们不是让 add 指令比其他的指令短些，而是 

在提供额外的灵活性方面为特大空间找到了用途。 

然而，有一个领域没有提供额外的灵活性，这就是存储器寻址。一般地， PowerPC 的算 

术和逻辑操作不能访问存储器。正式地说，只有两种寻址方式，寄存器方式和立即方式，如 

前面章节所定义。不同方式由特殊的操作码和助记符区分，一个无标记的助记符针对三个寄 

存器，而以 - i 结尾的助记符对两个寄存器和一个16位立即值进行操作， 例如： 

add r3 ( r2 f rl # 寄存器 3 « 寄存器 2 + 寄存器 1 
addi r6 f r5,4 # 寄存器 6 ■ 寄存器 5 +4 

(在一些汇编器中，这里可能存在一些困惑，因为允许程序员用编号引用寄存器 而七用 
r ? 标志。语句 add 2 , 2 , 1会将寄存器 1 的内容加到寄存器2中 • 它不是加数字 U 要做得更好 
些，编写代码时就不要粗心，即使汇编器允许你这么做。） 

当然，只有一个16位立即值可用（为什么？），我们不能对一个 32 位寄存器的髙半部分进 
行操作。有些操作 （ add , and , or 和 xor ) 采用了 - Is 作后缀的变形（这些指令对立即值进行 
左移16位的操作，允许程序员直接影响寄存器的髙位）。所以语句 
andis r3,r3,FFPF # r3 -= r3 and 0xFFFF0ee6 

将用 32 位模式 OxFFFFOOOO 与 r 3 的内容逻辑与，因此将寄存器的低半部分置为0。类似地， 
andis r3 f r3,0000 # rB * r3 and 0x0000006 

将整个寄存器清零 《 当然，也可以用寄存器-寄存器操作获得如下相同的 效果： 



xor r3.r3.r3 # 用 r3 与其自身异或（清零） 

subf r3.r3.r3 # r3 减去其自身（清零） 

<即使在 RISC 芯片上，也有多种方式来完成同样的功能。） 

你所期待的大部分算术和逻辑操作都具备了，这些操作有加 （ add , addi )、 减 ( subf , 
subfl )、 求反（算术反转， neg )、 与 （ and , andl )、 或 （ or , ori ), 异或 （ xor )、 与非 
( nand )、 或非 ( nor ), 乘和除等。还有一组功能强大的移位和循环移位指令。为了简化芯片 
的设计逻辑，不是所有的这些操作都有立即形式（毕竞是精简指令集计算），但是很少会有程 
序员失去立即方式 nand 指令的便利。一些汇编器提供了助记符别名一例如， not 指令并不是 
由 PowerPC CPU 提供的 a 它能用来模拟“同常数0的 nor ”， 因此不是必须由 PowerPC 提供。反 
而一个聪明的汇编器会辨识 not 指令并且输出等价的结果而没有异议。像通常一样，乘和除有 
些复杂。经典的问题就是两个32位因子相乘通常会产生64位的乘积，它无法装入一个32位的 
寄存器中。因此， PowerPC 支持两个独立的指令 miillw 和 mulhw , 它们分别返回乘积的低字和 
髙字。这些操作都使用通常的3参最格式，所以 

mullw r8,r7,r6 

计算乘积 r 7 • r 6 然后将低字放入#。除法通常分为有符号除和无符 号除： divw 和 divwu 。 
这些助记符中 ‘ w ’ 的含义表示对字 （ word ) 的操作。 


7.3.2 浮点搡作 

对于浮点数的算术指令类似，但是要用64位浮点寄存器而不是普通的寄存器，并且助记 

符以一个 f 开头。因此两个浮点数相加就是 fadd # 默认情况下，所有浮点指令都对双梢度 （64 

位）量进行操作，但是内部有一个 s 的变形（如， faddsx ) 指定32位值。更进一步， FPU 能够 

以整数格式存储/栽入数据， FPU 自身能够处理浮点数和整数之间的转换。 

在 PowerPC 上编写代码的一个危险是不同寄存器共李相同的编号。例如，指令 

fmul r7, r8, r9 參乘 

add r7, r8, r9 # 加 

两条指令好像对同一组寄存器进行操作。实际上不是。第一条语句对浮点寄存器操作， 
而第二条是对通用寄存器操作。在一些汇编器中，在恰当的场合下，自然数也被解释为寄存 
器编号。这意味着语句 


add 7, 8, 9 
addl 7, 8, 9 



完全不同。第一条将寄存器8和寄存器9中的值相加，而第二条将寄存器8中的值与立即整 
型常数9相加。特別*告。 


73.3 比较和条件标志 

大多数计算机在缺省情况下会在每个算术或逻辑操作之后更新条件寄存器相应的内容， 
PowerPC 则稍有不同。第一，已经提到过， PowerPC 没有单一的条件寄存器。更重要地，比较 
只在明确需求时进行（这有助于支持为了获取速度重排指令次序的思想）。最简单的请求比较 
方式就是在整型操作码末尾添加句点符 （. ）。这将根据运算结果大于、等于或者小于零来设 
置条件寄存器 CRO 的位段。 

更一般地，两个寄存器（或者寄存器与立即方式的常数）之间的比较使用 cmp 指令的变形。 
这可认为是最奇特的3参*指令，因为它不仅带有两个要比较的参量（第二和第三参量），还 
有条件寄存器的索引。 例如： 
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CR1, r4 f r5 # 比较 r4 和 r5 

# 结果在 CR1 中 


设置4位条件寄存器1中的位来反映 r 4 和 r 5 的关系，如表 7-1 所示。 

表 7-1 cmpw CR 1. r 4. r 5 执行后 CR 1 中的值 


该位设 S 为 1 的含义 

bitO 

r4<r5 ( 结果小于 0) 

bitl 

r4 = r5 ( 结果等干 0) 

bit2 

r4>r5 ( 结果大于 0) 


73.4 数据移动 

如同 JVM , 要将数据移入/移出存储器，可用专门的载入和存储指令。栽入指令一般有两 
个参量，第一个 参置是 目的寄存器，第二个参 a 是要载入数据的逻辑地址（也许要经过存储 
管理，前面已描述）。和 JVM —样，有不同的指令对应不同大小的数据移动，载入数据的指令 
都以字母〗开头，接下来的字符指明要移动的数据是一个字节 （ b )、 半字 （ h , 2个字节）、字 
( w , 4个字节），还是双字 （ d , 8个字节 • 明显地只在 PowerPC 的64位版本上可用，因为只有 
这个版本能够在寄存器内存储如此大的*)。栽入指令显然也能加载羊梢度 （ fs ) 和双精度 
( fd ) 浮点数。当然，不是所有的数据都从存储器载入 • 11指令用立即方式载入常数。 

当载入 tt 少于一个字时，有两种不同的方式填充寄存器的其余部分。如果指令指明“零 
载入”（使用字母 z ), 寄存器的髙位部分就被 设置为 0,而如果指令指明“代数栽入” （ a ), 即 
对寄存器的髙位部分进行符号扩展。最后，有一个更新模式可用，用 U 指定，将在下面解释。 

要了解下面的实例，假设 （ EA ), “有效地址”的简写，是一个存储单元，该单元内存有 
适当容 M 的存储块，目前保存的是全1位模式。指令 lwz rl , ( EA ) 将位于 （ EA ) 的字载入到 
寄存器1中并且（在6 4 位机器）将寄存器其余部分置0。在一个32位 PowerPC 上，寄存器1将包 
含值 OxFFFFFFFF , 而在64位机器上，寄存器1将保存值 OxOOOOOOOOFFFFFFFF 。 表 7-2 给出了 
栽入指令的其他一些工作示例。 

表 7-2 PowerPC 載入指令的一些示例 


指令 

lbz rl , (EA) 
lhzrl, (EA) 
lharl, (EA) 
lwzrl, (EA) 
ldrl, (EA) 


32 位寄存器结果 


[000000FF 

lOOOOFFFF 


64 位寄存器结果 
OxOOOOOOOOOOOOOOFF 




不允许 



Ox FFFFFFFFFFFFFFFF 


在此有一些警告。也许最明显的是，即使在一个64位机器上，也无法“扩展” 一个64位 
双字量。在32位 PowerPC 上也没有办法直接对 双字* 进行操作，或者32位 CPU 中没有办法将 
字进行代数扩展至双字。因此，32位 PowerPC 指令集中不含 lwa 指令，并且 lwz 指令载入一个 
32位量但是不做任何零扩展。最令人困扰的， PowerPC 体系结构不允许对字节量进行代数扩 
展，所以指令 lba 也不存在。除了这些例外，载入指令非常完备并且很好理解。例如，指令 
Isu r 3, ( EA ) 从存储器载入了一个单精度浮点数，使用了迄今为止还未定义的“更新”和 
“索引”模式。 

从寄存器向存储器存储数据的操作类似，但是以 “ st ” 开头并且不用考虑扩展问题。指令 
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sth r 6, ( EA ) 将寄存器 r 6 的低16位保存在 EA 存储单元，而 sthu , sthx 或者 sthux 指令完成同 
样的功能，但是分别使用更新模式，索引模式或两者结合。 

7.3.5 转移 

汇编语言程序设计最后一个基础方面就是控制/转移指令。正如我们所期待的 ， PowerPC 
支持无条件和条件转移。无条件转移的助记符就是一个简单的 b , 带有单独一个目标地址。条 
件转移指令（有几种变形，统称为 b ?) 包括一个参量和条件寄存器， 如下： 


bgt 

CRO, 

address 

» 如果 CRO 的位 1 被贊 1 則转移 

bit 

CR1, 

address 

# 如果 CR1 的位 0 被 fil 則转移 

beq 

CR2, 

address 

• 如果 CR2 的位 2 被 ffl 則转移 

ble 

CR3, 

address 

轉 如果 CR3 的位 1 被霣 0 則转移 

bne 

CR4, 

address 

• 如果 CR4 的位 2 被置 0 則转移 

bge 

CR5, 

address 

#如果 CR5 的位 0 被置 0 則转移 


PowerPC 不支持单独的跳转-至-子程序指令，但是有一个专用链接寄存器完成类似的任 
务。还有一个用于循环的专用计数寄存器。这两个寄存器都由专用的指令使用。 

尽管 RISC 设计简洁，仍然有很多可用的指令，我们不能一一介绍。特别是，超级用户级 
寄存器如 BAT 和段寄存器都有自己的指令进行访问。如果需要为 Power 芯片编写操作系统，那 
么你首先需要读些其他的书。 


7.4 再论锥形山 


再来看我们的老朋友，锥形山，这是我们已经举过的 例子。 为了表示的简洁性，这个例 
子假设可用64位操作。同样为简单起见，假设 n 值在存储器中可用，表示为存储单元 ( PI )。 如 
第2章所述，原问题描述 如下： 

底部呈圆形直径 450 m 并且高1 50 m 的山体体积是多少？ 

由于可用寄存器很多，解决该问题就十分简 单了： 

第一步是计算半径，用直径除以2,然后再求其平方。 


li r3, 450 
11 r4, 2 

divw r3, r3, r4 
mullw r3, r3, r3 


卉径簌人 r3 
除以 2 得到半径 
将半径放人 r3 
半径平方 


第二步将数据（经由存 储器） 移至 FPU 。 


std (EA),r3 
ldf rl0 f (EA) 
fcfld r9, rl0 

第三步载人 Jt , 并与其相乘。 

ldf r8, (PI) 
fmul r7, r8, r9 
fcfid r9, rl0 


将乍径平方存为 64 位整数 
栽人半径平方 
转换为浮点 


栽人用 f 乘法的 a 

篇 tt 为浮点 


最后，载入高度 （150) 并作乘法，然后将最终 S 除以3。为了淸除起见，我们首先以整 
数形式加载，然后将它们传给浮点处理器，如下： 

#我入高度 

#存为整数 
#将髙度栽入 FPU 

#转换为浮点 
#相乘 


11 

std 


r5, 150 
(EA).rS 
ldf r6, (EA) 
fcfid r6, r6 
fmul r7, r6, r7 


li 

std 


r5. 3 
CEA). 


载人常数 3 
存为整数 



ldf r6, (EA) 
fcfid r6, r6 
fmul r6 f r6, r7 


# 将 3 栽人 FPU 
# 转换为浮点 
# 相乘 


注意在这个例子中，寄存器3到寄存器5总是用于保存整数，因此一直是通用寄存器，而 
寄存器6到寄存器10总是用于保存浮点数。这只是为了保证解释的清晰。 

7.5 存储器组织和使用 

一旦你了解了超级用户级存储器管理， PowerPC 存储器组织就简单了。如前面所讨论的， 
从用户的角度， PowerPC 提供了一个简单扁平的存储空间。存储空间的容量是 CPU 字长的一 

个简单函数-对于32位 CPU 是字节（大约 4 GB ) 而对于64位 CPU 是 2 M 字节。当然，没有 

计算机能拥有 16 EB 的物理存储器，但是这个容量为未来突破存储器成本留出了空间。存储器 
地址就是适当容摄的 编号： 半字，字，和双字在存储空间中按适当对齐的间隔得到保存。（实 
际上，这是一个谎言。字节就是字节 • 但是指令例如 Id rO , ( EA ) 只有当 ( EA ) 指向一个8的倍 
数的有效地址时才能工作。否则，一个智能的汇编器/编译器就需要将双字载入拆分成8个部 
分载入和移位指令，这会减慢代码的速度。所以，不要采用这种做法。佯装对象已经按照合 
适的对齐位置保存，这样会感觉更好。） 

PowerPC 的一个关键特征是直接支持嵌人到 CPU 指令集的 big - endian 和 little - endian 数据存 
储。这个特征继承自 IBM 和 Motorola , 它们都有大规模的产品系列和大量的代码需要支持，但 
是在这方面做出了不同的选择。 CPU 中的数据总是以相同的方式保存，但是在存储器中数据 
要么以正常格式要么以“字节反向”格式存储。 

除了这些复杂性之外，存储器寻址操作相当简单。 PowerPC 支持两种基本寻址方式，间 
接寻址和索引寻址，唯一的区别在于涉及的寄存器数 ft 。 

在间接方式中，计算机用16位立即偏移值与单一寄存器指定的内容之和作为有效地址。 
例如，如果寄存器3中有值0 x 5678,那么指令 

lwz r4, 0xl000(r3) 

将保存在 0 x 66*78 ( 0 x 1000+0 x 5678) 单元的值栽入到寄存器 4 的低32位 （ w )。 在64位的机 
器中，因为 z 所以髙32位被设置为0。对于大多数程序而言， 0 x 1000 由编译器定义，指向某个 
变量的偏移（如上所示）。 

在索引方式中，有效地址的计算也类似，但是用两个寄存器代替一个常数和一个寄存器。 
所以，在下面的指令中 

lwzx r4, 「 2 ， r3 

仅当寄存器2保存 0 x 1000 时有效地址是相同的。这提供了十分简单但是有用的两步方式访 
问存储器 I 第二个参最可用来定义一个特别的存储块一例如，全局程序变量的存储区一 
而第三个变量用来选择该块内的一个偏移（这在思想上与8088定义的段寄存器类似但更加灵 
活）。如果出于某种原因，该块作为一个整体被更换，只有一个寄存器需要改变，整个代码可 
以继续工作。 

对干许多应用而言，特别是那些涉及数组的应用，访问存储器时能够改变寄存器值将是 
非常方便的 （ Java 程序员已经熟悉了 ‘ + +’和‘-一’操作符）。 PowerPC 通过更新方式提供 
这类功能，在助记符中用 u 表示。在更新方式中，有效地址的计算依旧，但是寄存器内的值被 
更新为有效地址。 

举个例子，考虑下列语句的效果，这可能在一个循环的 中间： 



lwzu r4, 4(r3) 

add r5, r5, r4 


# 用更新方式访问 (r3+4) 
# 保存当前的总和 
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假设 r 3 包含0 x 10000,它是这个块的开头，第一条语句计算有效地址为 0 x 10004 并且将保 
存在该地址的字 （4 字节）值栽入 r 4。 到目前为止，所有的都是正常的。这个载入完成后， r 3 
的值将被更新为有效地址0 x 10004。下次邻近4字节存储单元，它是字数组内下一个元素的访 
问地址，此时 r 3 已经指向了那里。这可以节省很多时间和精力。这使得数组处理或者更一般 
的相似元素集合的处理变得非常高效。 

没有专用指令用于子程序，不存在标准化、硬件增强的系统栈或者系统栈指针槪念。取 
而代之，程序员（更可能，操作系统）借用一个或多个寄存器（通常 rl ) 做栈指针并且使用 
标准的寄存器/存储器操作来代替压栈和出栈操作。这不仅维护了 RISC 理念（既然已经完成处 
理，为什么还要创建专用的出栈指令？），而且允许不同的程序和系统建立不同的栈帧。再者， 
Apple , IBM 和 Motorola 都有大董的代码基要得到支持，它们对栈的看法不同而且不兼容，所 
以人们能够明白这个委员会做出这一设计准則的道理。 

7.6 性能问题 

流水化 

如同我们已经研究过的其他芯片，计算机的性能是成功的关键 9 每个新型计算机都要比以 
前的快。为了实现这一目标， PowerPC 提供了大规模的流水化体系结构（见 5.2.4 节）。使 JVM 
运行更快的一个不费力方式就是在一个更快的芯片上执行它。为了使 PowerPC 芯片运行更快些， 
人们不得不让芯片本身再快些，或者用某种方式在每个系统时钟内压缩更多的计笕。为了做 
到这一点， CPU 有一个更加复杂的，流水化的取指-执行周期，允许同时处理几条指令。 

RISC 体系结构的一个特征就是良好的流水化工作。注意流水线性能的两个关键是保持流 
水线一直流动以及每个阶段近似均匀。 RISC 指令集经过特别设计，所有的指令花费同样的时 
间，并且通常能在单机器周期内执行。所 q , 在进行取指令的同时机器还能执行加法指令， 
并且流水线始终保持平稳。这有助于解释 PowerPC 上有限数目的寻址 方式， 一条将一个存储 
单元与另一个相加的指令除了简单的加操作之外还需要4个栽入操作和1个保存操作，因此需 
要4倍的时间（拖延流水线）。 PowerPC 强迫这个操作被写成4条分开的指令。因为流水化的操 
作，这些指令仍然在同一时间进行，但可互相协调平稳地完成整个计算，获得良好的性能。 

取指令是另一个可以进行优化的方面。对于 Pentium , 指令长度可变，从1个字节到15个 
字节。这意味着它取某条指令的时间会是另一些指令的15倍，而当一个非常长的指令被载入 
时，流水线的其余部分就可能会空闲。相比之下， PowerPC 中所有的指令都是等长的并能用 
单一操作载入，保持流水线是充满的。 

当然，有些类型的操作（例如，浮点运算）也需要大量的时间。为了解决这一点，浮点 
运算的执行阶段本身被流水化（例如，用不同的乘、加以及舍入阶段进行处理），以便它仍然 
能够以每个时钟周期一条指令的呑吐率进行运算。有时，延迟也是不可避免的，有一种机制 
可以在必要的时候让处理器停顿，但是一个好的编译器能够编写代码尽可能地最小化延迟。 

另一种情况也很容易中断流水线，就是载入不适当的数据，从存储器中不适当的单元取 
数。在这方面最坏的冒犯者就是条件转移，如“如果小于则转移”。一旦遇到这条指令，下一 
条指令要么来自于指令序列中邻近的下一条，要么来自于转移目标处的指令——我们可能不 
知道是哪一个。亊实上，我们通常无法判定需要哪条指令，因为条件取决于计算结果，而这 
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个计算将在流水线中进行，我们目前无法得到计算结果。 PowerPC 采取设立多个可用的条件 
寄存器来辅助，有了一个直通的流水线，当转移指令开始执行时，转移目标已经被确定，正 
确的指令即可被载入。 

如同我们将要看到的 Pentium ， Power 体系结构也吸纳了超标量体系结构的成分。实际上， 
超标量设计与 RISC 体系结构的关系要比 CISC 芯片更为紧密，但是好的设计思想就是好的设计 
思想，往往会被广泛采纳。回顾 5.2.5 节，这一设计理论吸纳了多条独立不相关指令能在 CPU 
内的不同部件上并行执行的思想。再者， Power 体系结构的简化指令集也有助于这一点一算 
术运算与载人/存储操作，或者比较操作分离，大置寄存器使得一系列指令使用非重番寄存器 
(因此能并行化）变得更容易。 

典型的 PowerPC CPU 用独立的模块处理不同种操作（如同早期 ALU 和 FPU 之间的区分， 
只是部件更多）。通常，一个 Powei •芯片至少有一个“整型单元”、一个“浮点单元”和一个 
“转移单元”（处理转移指令），还可有一个“载入/存储单元”等。 PowerPC 603有五个执行模 
块，分別处理整型运算、浮点运算、转移、载入/存储以及系统寄存器操作。对于更高端的芯 
片版本，常用单元会在芯片上物理复制，例如， PowerPC G 5 芯片有10个独立的 模块： 

• 〗个交换单元（完成专门的“交换”操作） 

• I 个逻辑运算单元 

•2 个浮点运算单元 

•2 个定点（寄存器-寄 存器） 运算单元 

• 2个栽入/存储单元 

• 1个条件/系统寄存器单元 

• 1个转移单元 

借助这一组硬件， CPU 能够同时（在同一取指-执行周期）执行多达10条不同的指令。在 
指令队列的容 * 范围内，第一条栽入/存储指令将被送至载入/存储单元，而第一条浮点指令将 
被送至浮点单元，等等。在理论上你能理解下列全部指令完全可以在同一时间内 完成： 


add 

r3 t r2,rl 

# 

« 数相加 

sub 

r4.r2.rl 

# 

另一个定点抉作 

xor 

r5,r5,r5 

# 

使用 $« 单元淸零 r5 

faddx 

r7,r6,r6 

• 

两个浮点数相加 

fsubx 

f8.r6,r6 

somewhere 

# 

使用汀点申 - 元清零 r8 

b 

# 

钱移到 somewhere 


类似地，这些指令中有一半可以在这个周期执行而另外一半在下一个周期进行，或者， 
这些指令每次执行一条，但是以方便计算机的次序，不一定按照编写的代码次序。 

还需要一些特殊的性质才能对程序代码做如此巧妙的处理。首先，指令不可相互依赖，如 
果上述第2条指令改变了寄存器4的值（它就是这样做的）并且第5条指令需要使用这个新的值， 
那么第5条指令就至少要到第2条指令结束之后才能开始。然而，借助32个可用的通用寄存器， 
一个智能编译器通常能找出一种方式在寄存器之间分布计算以便最小化这种依赖关系。相应地， 
指令应是不同类型的：只有一个逻辑龟元，每次就只能执行一条逻辑指令。如果程序的某个部 
分由连续30条逻辑指令组成，那么该部分被添加到指令队列而且只能每次分派一条指令，基本 
上将计算机减慢10倍。此外，一个智能编译器会尝试混合代码确保队列中的指令类型不同。 


7.7 本章回顾 


• PowerPC ， 由 Apple 、 IBM 和 Motorola 联合设计，是大多数 Apple 桌面计算机的内置芯片。 
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它是 RISC (精简指令集计算）方法设计 CPU 的示例，指令数量相对较少，执行速度很快。 

•Power 体系结构是（主要）来自 Motorola 和 IBM 已有设计的灵活折衷。直到近来， 
PowerPC —直是 Apple 计算机的基本芯片， Powei ■芯片仍然主导游戏控制台领域。 Rower 
芯片实际上是可交叉兼容的芯片系列，其在体系结构的细节中又有很多不同。例如， 
PowerPC 存在32位字长和64位字长两个版本，并且每个芯片与软件交互的方式都极其灵 
活（例如，任何 Power 芯片都能以大端和小端格式存储数 据）。 

•Power CPU 有32个通用寄存器和32个浮点寄存器，还有专 厲芯片 的专用寄存器，比 
P en ti Um / X 86 的寄存器要多。该芯片也对几种不同方式的存储管理提供硬件支持，包括 
对 I / O 设备的直接（存储器映像的）访问。 

•为了处理速度和简易性， Power 所有指令都是等长 （32 位）的。 

•Power 汇编语言用3参量格式编写。如同大多数 RISC 芯片，寻址方式相对较少，数据移 
入移出寄存器由与算术运算分离的专门栽入/存储指令处理。 

• PowerPC 有若干不同的条件寄存器 （ CRS ), 这些条件寄存器能独立地访问。 

• 为了加速芯片， PowerPC 利用流水化的超标量体系结构执行指令。 

7.8 习题 

[RISC 芯片与 CISC 芯片相比优点是什么？缺点是什么？ 

2. Power 体系结构设计的灵活性有哪些实例？ 

3•与8088系列相比 Power CPU 为什么有这么多的寄存器？ 

4. owerPC 算术指令采用3参 k 格式的优势是 什么？ 

5. and 和 andl 指令之间的区别是什么？ 

6. aml * and 1. 操作之间的区別是什么？ 

7. PowerPC 为什么没有标准化的、硬件支持的栈帧格式？ 

8•对于流水化来说，为什么所有指令等长很 * 要？ 

9. 由 JVM 提供而不是 PowerPC 直接提供的指令是什么？ PowerPC 如何实现这条指令？ 

10. 重排计算次序是如何加速 PowerPC 程序的？ 
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8.1 背景 

你最后一次是什么时候问计算机价格的？你问的是哪种计算机的价格？对于世界上大多 
数人，第二个问题的回答可能都是 “ Pentium ”。 由 Intel 制造的 Pentium 计算机芯片是世界上最 
杨销的硬件体系结构。即便像 AMD 这样的竞争对手通常也会非常认真地确保他们的芯片与 
Pentium 的效果一样，连毛病也一样。甚至不运行 Windows 的大部分计算机（例如，大部分 
Linux 机器）也使用 Penthim 芯片。 

这意味宥可预见的未来，如果你必须为一个真实（基于硅片）计算机编写汇编语言程序, 
可能就会为 Pentium 编写。为了充分发挥汇编语言的速度，你必须了解这种芯片和它的指令集， 
以及如何使用。 

遗憾地，这是一个复杂的任务，因为 “ Pentium ” 本身是一个复杂的芯片，也因为 
“ Pentium ” 这个术语实际是指一个系列但稍有不同的 芯片。 琅初的 Pentium , 早在20世纪90年 
代制造，已经经历了连续的发展，包括 Pentium Pro、Pentium D 、 Pentium ID , 以及目前的 
Pentium 4 [ P 4] 0 期望这个发展继续，毫无疑问 Pentiums , 6, 7将会继续，除非 Intel 决定改变 
名称但保持系统兼容（就像80 4 86和 Pemiurn 之间所发生的改变）。 

这个成功的发展使得学习 Pentium 体系结构变得既容易又困难。由于最初 Pentium (以及先 
期的 x 86 系列）的巨大成功，已经有了成百万计的程序是为前期的芯片版本编写的，人们仍然 
想要它们运行在新的计算机上。这就造成了向后兼容的压力，向后兼容要求现代计算机能够 
奄无问题地执行为原有计算机编写的程序。所以，如果你理解了 Pentium 体系结构，意味恭你 
理解了大部分 P 4 体系结构（以及 x 86 体系结构）。反过来，每项新措施的提出会增加新的特性 
而不消除老的特性。这使得 Penthmi 几乎成了 CISC 体系结构的接收站，因为曾经需要的每个特 
性依然存在——每个设计决定无论好坏都反映在当前的设计中。不像 JVM 的设计者可以从零 
记录开始， Pemirnn 设计者在每个阶段都必须从现有的系统开始，然后对其进行增 ft 地改善。 

这使得 CPU 芯片的基础组织非常复杂，如同一个房子经历了修补，之后再修补，之后再 
修补。下面就让我们来看一下吧…… 

8.2 组织和体系结构 

8.2.1 中央处理单元 

Pentium CPU 的逻辑抽象组织与前面描述的8088体系结构非常相像，只是多了些内容。特 
別是，有更多寄存器，更多总线，更多可选内容，更多指令，总之，每件亊都有更多方式去 
做。同8088—样，仍有8个称为通用的寄存器，但是它们已经被扩展成能容纳32位的最并且有 

了新的名字。这些寄存器现在是 

EAX EBX ECX EDX 

ESI EDI EBP ESP 

实际上， EAX 寄存器（其他的也 如此） 只是原来 （16 位） AX 寄存器的一个扩展。如同 
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AX 寄存器被分成 AH/AL 对， EAX 寄存器的低 16 位就来自 8088 的 AX 寄存器。由于这个原因, 
使用 16 位 AX 寄存器的原有 8088 程序能继续运行在 Pemium 上。 


EAX (32 位 > 

未使用 

AX (16 位） 


AH (8 位） AL (8 位） 


类似地，16位 IP 寄存器已经变成 EIP 寄存器，这个扩展指令指针包含将要执行的下条指令 
的存储单元地址。不再是原来的4个段寄存器，我们现在有6个段寄存器 （ CS , SS , DS , ES , 
FS 和 GS ) 用来对经常使用的区域进行存储器访问优化。最后， EFLAGS 寄存器保持32个标志， 
不再是原来的16个标志。除了段寄存器之外，所有这些寄存器都是32位宽。这就意味着 
Pemhrni 有32位字长，并且大多数操作处理32位的 i 。 

除了这些，8088与 Pemiurn 之间一个主要的变化就是建立了不同的操作模式支持多任务。 
在最初的8088中，任何程序都可自由地访问全部寄存器集，并且通过扩展存储器以及挂接的 
外部设备——最终，完全控制整个系统及其所有内容。这是有用的。它也可能是危险的 •胃 
着卷入古老的“战争 故亊， 的风险，作者的早期经历是为最初的 IBM-PC 编写髙速图形程序， 
由于错误地将图形数据放到了硬盘控制器使用的系统存储器区域，当试图使用“被修改”的 
参数启动时，系统无法正确地 T 作。 

为了防止这类问题， Pemiurn 能在不同的模式下执行，这些模式能控制执行指令的种类， 
也能控制存储器地址的解释方式。两个特别关注的模式是实模式和保护模式，实模式基本上 
是8088操作环境的详细翻版（每次运行一个程序，只有1兆字节的存储器可用，没有存储保护）， 
保护模式采用后面 （8.4.1 节） 描述的存储莳理系统支持多任务 # IBM - PC 锒初的操作系统 MS- 
DOS 运行在实模式下，而 MS-Windows 和 Linux 都运行在保护換式下。 

8.2.2 存储器 

Pentium 支持不同的存储器组织和访问方式，但是我们在这里忽略关于它们的大部分内容。 
首先，它们非常复杂。其次，（从程序员的观点）多数复杂的部分是从古老的8088体系结构继 
承来的。如果你必须在 Pentium 上编写模拟8088实模式的程序，才有必要了解这些内容。当你 
为现代计算机写程序时，任务变得很简单。将存储器视为一个32位地址的扁乎组织将会解决 
用户级的所有必要工作。 

8.2.3 设备和外设 

Pemiuni 和早期8088的外设接口之间几乎没有重大差别，这也是由于 Pentium 的兼容性设 
计。当然，对于计算机厂家而言这是一个巨大的优势，因为用户能够买到新的计算机并且使 
用原有的外设，在每次升级主板时不必去买新的打印机和硬盘。 

然而，随着计算机（和外设）的功能变得愈发强大，新的接口方法开始使用，这就需要 
设备和 I/O 控制器去做更多的工作。例如， MS-DOS 编程中直接 BIOS 控制需要标准形式来访问 
保护模式编程下的非兼容硬件。取而代之，用户级程序对 I / O 硬件的访问将通过操作系统来控 
制（并且限定）访问设备的驱动程序请求。 
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8.3 汇编语言 

8.3.1 搡作和寻址 

Pentium 指令集中大部分指令直接从8088继承而来。理论上，从兼容的角度讲，任何为 
8088编写的程序都可在 Pemiuni 上执行。 Pentium 使用同样的 两参量 格式，甚至在多数情况下 
助记符都是相同的。唯一主要的改变就是更新了寄存器助记符来反映扩展 （32 位）寄存器的 
使用《指令 

ADD EAX, EBX , 32 位寄存器到 32 位寄存器的加法 

是合法的，其功能很明显。 

许多新的指令得以创建，明显针对32位的量。例如，针对串原语 MOVSB 和 MOVSW (复 
制一个字节/字串，前面章节定义的）已经加入了一条新的 MOVSD ， 它将一个双字 （32 位） 
串从一个存储单元复制到另一个单元。 

8.3.2 高级操作 

Pentium 也提供了许多全新的操作和助记符，这里不能一一描述。这些指令中很多（也许 
是大部分）都是执行（常用）任务的捷径，与使用简单的指令相比所需的机器指令数很少。 
例如，一条指令 （ BSWAP ) 交换一个32位寄存器（被指定作为一个参量）的末字节，这个任 
务使用十多个基本的算术指令才能完成。另一个例子是 XCHG (交换）指令，它将源和目的 
参量互相交换。这些特定操作背后的基本思想是功能强大的编译器能够产生髙度优化的机器 
代码以便锒大化系统性能。 

这类新指令的另一个例子是新的控制指令， ENTER 和 LEAVE , 它们用来支持高级语言中 
函数和子程序的语义，这些髙级语言包括 C 、 C ++、 FORTRAN 、 Ada 、 Pascal , 等。如 6.4.7 节 
中所见，这些语言中的局部变货通常放在子程序局部帧系统栈的临时空间。新的 ENTER 指令 
在将控制转移到一个新位 置时大 设地复制了 CALL 语义，将原有的程序计数值保存在栈中，与 
此同时，它构建了 BP / SP 栈帧并且为一组局部变最预留了空间，因此用一条相当复杂的指令替 
代了半打简单的指令。它也为如 Pascal 和 Ada 等语言（但不包括 C , C ++ 或 FORTRAN ) 的嵌套 
声明特性提供了一些支持。 LEAVE 指令作为单一指令（尽苷十分奇特，它不执行从子程序的 
返回，所以仍然需要 RET 指令）就能取消栈帧创建 # 这些指令节省程序代码的字节，但是 
(与设计者的愿望相悖）作为单一慢速指令它们执行所花的时间要比被它们替代的一组指令执 
行所花的时间还长。 

另外特別增加用来支持高级语言的指令是 BOUND 指令，该指令检査一个值在两个指定上 
界和下界之间。要检査的值作为第一个操作数给出，第二个操作数指向两个（邻近）存储单 
元给出上界和下界。这允许高级语言编译器检査一个数组能够安全地访问。同样，这可用更 
多传统的比较/转移指令完成，但是要用半打指令并且可能会覆盖一些寄存器。取而代之， 
CISC 指令集用最小的努力让系统完成清晰快速的操作。 

多种操作和存储管理模式需要有它们自己的指令组。这样的指令包括 VERR 和 VERW ， 它 
们分别验证某个段能够被读出或是写入。另一个例子是 INVD 指令，它淸空内部 cache 存储器 
以便确保 cache 状态与系统主存的状态是一致的。 

最后， Pentium 不断的发展，从 Pentium Pro 开始连续经过 PD ， Pm 和 P 4, 已经给基本的 
Pentium 体系结构增加了新的能力一也包括新的指令和特性。例如 ， Pentium ID (1999 年） 
增加了一组特殊的128位寄存器，这些寄存器中的每一个都能装入4个 （32 位）数。增加的新 
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指令中有（专用的，当然了）同这些寄存器打交道的指令，包括一组 SIMD (单指令，多数据) 
指令，这类指令将同样的操作并行地应用到4个独立的浮点数上。利用这些新的指令和寄存器， 
浮点性能得以显著地增加（大约 4 倍），这意味着计算量大的程序如计算机游戏运行速度显著 
加快——或者说，好的程序员能将4倍髙质量的图形包装到游戏中却不会降低其速度。很妙， 
是不是？ 

此时，你也许怀疑怎么可能记住所有这些指令。答案是，感谢上帝，并不期待你这样做。 
Pemiimi 指令集是庞大的，超出了大多数不是每天都与其打交道的人的记忆能力。实际上，只 
有编译器需要了解这些指令以便能够选择所需要的指定操作。 

8.3.3 指令格式 

与其他的计算机不同，特别是大多数 Power 体系结构计算机以及 JVM , Pemium 不要求所 
有的指令 等长。 取而代之，简单的指令——例如，一个寄存器-寄存器的 ADD 或者从子程序返 
回指令 RET —仅1或2个字节得到保存并解释，可以快速地取出而且在存储器或硬盘中占用 
的空间很少。复杂的指令可能每条畨要高达15个字节。 

复杂的指令会包含什么信息？最明显的类型就是立即方式的数据，如（十分明 M ), 32位 
数据将给任何指令增加4字节的长度。类似地，一个用于间接寻址显示 （32 位）命名的地址也 
增加4个字节，所以指令 

ADD [EBX] f 13572468H , 向存储器中加 32 位的 ft 

至少比简单的指令起出4个字节的长度。（在前面的章节中，我们已经明白了典型的 RISC 芯片 
如何处理这类问题，基本上将上述指令拆分为多个子阶段。） 

除此之外， S 杂的指令需要更多的信息。由于多种寻址方式， Pentium 要用更多的位（典 
型的是1个字节，有些是2个字节）来定义哪种位模式将被解释为寄存器、存储器地址等。如 
果一条指令使用了非标准段（不是缺省的而是为特种指令类型产生的），另外一个可选择的字 
节就会编码这个信息，该信息包括要使用的段寄存器。用于串操作的多种 REP ? 前缀就用了 
另外一个字节编码。幸运的是，这些复杂性相对少见，多数指令并不采用。 

8.4 存储器组织和使用 

存储管理 

Penthim 存储器最简单的组织是将其作为一个32位扁平的地址 空间。 每个可能的寄存器模 
式代表了存储器中一个可能的字节 单元。 稍大些的模式（由于传统的原因，一个16-位字节模 
式通常被称为“字”，而一个32位字被称为“双字”）可以增补两个或多个邻近的字节单元。 
只要计算机能够辨认出多少字节在用，访问长度变化的存储单元就非常简单了。这个方法也 
非常快，但是有很大的安全隐患，因为任一存储单元，包括操作系统或者在该机器上执行的 
其他程序使用的存储单元，都可能被篡改。（还记得我的硬盘控制器吗）？所以，这种简单的 
组织（经常被称为不分段页的存储器）很少使用，除非由于控制器芯片或者其他需要计算机 
实时、快速地执行任务的应用。 

在保护模式下，需要额外的硬件防止程序被非正常修改。从8088继承来的段寄存器 （ CS , 
DS 等）提供这方面的支持。和8088—样，通用寄存器表示的每个存储器地址将被解释成相对 
指定段的地址。然而， Pentium 中段寄存器内容的解释稍有不同。两个16位用作保护级解释， 
而其余的14位定义了对这个32位地址的一个扩展，这样创建了一个46位 (14+32) 有效虚拟或 
逻辑地址。这就允许计算机访问超出32位 (4 GB ) 的地址空间并且将存储区标记为某些程序 
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不可访问的，以此来保护私用数据。 

然而，要通过存储器总线（只有32条，因此用32位地址）来访问，这些46位地址仍然需 
要被转换成物理地址。从这些虚拟地址到32位物理地址的转换任务由分页硬件处理 。 Pentium 
包括一个页表项的目录，该页表项作为这个转换任务的翻译系统。分段和/或分页硬件的使用 
能被单独地启用或者禁用，这就允许系统用户（或者，更加可能是操作系统的编写者）针对 
某个应用来调整。从用户的视角，很多复杂的亊情都由硬件处理了，所以你只管写你的程序 
而不需要担心这些。 

8.5 性能问题 
8-5.1 流水化 

改善芯片性能的现代标准技术是流水化。与一些其他的芯片相比，尽管 Peruium 的指令集 
不太适于发挥流水化的优势，但是它还是充分地利用了这项技术（如图8-1)。 

甚至在 Pentium 开发之前 ， Intel 80486就已经采用了5阶段流水线执行指令。5个阶段是： 
•取 指： 取出指令并将其放入一个预取缓冲区中，预取缓冲区有两个。每个缓冲区都能保 
存高达16字节 （128 位），其操作与流水线的其他部分独立无关。 

•译码阶段1:指令译码分为两个阶段进行，第一个阶段作为指令类型的预分析，决定在 
整个指令中必须提取（以及从哪提取）哪些类型的信息。具体地， D 1 阶段提取有关操 
作码和寻址方式的基本信息，不一定涉及地址的细节。 

•译码阶段2:完成指令译码的任务，包括偏移和立即数的辨別，产生 ALU 控制信号。 

•执 行： 该阶段执行指令。 

•写回：该阶段用上一阶段产生的结果更新寄存器、状态标志以及 cache 存储器。 


预取 （ PF ) | 


U 


指令译码 ( ID 1) 


7- 



| 指令译码 UD 2) | 


| 指令译码 ( ID 2) | 

1 


1 

| 执行 （ E ) | 


| 执行 （ E ) | 

1 


1 

i 写回 （ WB ) | 


| 写回 （ WB ) 1 





图 8-1 Pemium 5 阶段流水线示意图，包含超标量 U 和 V 流水线 
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这个流水线比我们已看到的其他流水线（如 Power 芯 片的） 更复杂，部分原因是它要处理 
的指令集的复杂性导致的。注意 Pentium (甚至 486) 指令长度从1到15个字节之间变化。这是 
预取缓冲区需要这么大空间的部分原因，它们必须能完全容纳下一条指令。也是由于相同的 
原因，需要花很长时间译码复杂指令一有时和执行一条简单指令时间一样，其至比这还长。 
寻址方式的数董和复杂性是主要因素，因为它们为简单的逻辑或算术操作增加了额外的解释 
层。出于这个原因，就有两个分开的译码阶段以便保持流水线平稳快速地流动。80486能够以 
接近每个机器周期一个操作的速度执行不含存储器访问的大多数操作。即使如此，间接地址 
(寄存器中的值作为存储器地址）以及转移都能减慢流水线。 

流水化在 Pentium 及其后来版本中使用相当广泛。不仅有多条流水线（反映超标置体系结 
构）而且每条流水线还有更多的阶段。初期的 Pemhim 有两条流水线，每条流水线有5个阶段， 
如上所列 。 Pentium n 增加了流水线的数董，并且将每条流水线的阶段数增加到12,包括一个 
判断每条指令长度的特殊阶段。 Pemhimm 使用 I 4 阶段流水线， P 4 使用24阶段流水线，在此无 
法做详细讨论。尽管没有为流水线设计有效的指令集， Pentium 还是将流水线使用到了极致。 

8.5.2 并行操作 

为了允许真正的并行操作一在 CPU 内同时执行两条指令， Pentium 采用了其他两个重要 
的体系结构特性。自 Pentium II 开始，指令集以 MMX 指令为特色专门服务多媒体应用，如高 
速图形（游 戏） 或者声音（同样也是游 戏）。 这些指令实现了 S 1 MD (单指令，多数据）类别 
的并行，这里对几个独立的数据执行同一个操作。 

典型的多媒体应用涉及处理相对少量的数值数据构成的大型数据阵列（例如，屏幕图像 
中的像素），并对每个数据执行同样的运算，运算速度之快以致于察觉不到图像的闪烁。为了 
支持这个操作 ， Pentium n 定义了一组 MMX 寄存器，毎个寄存器都是64位长，保存8个字节， 
4个字，2个双字，或者不常用的8字节四字。 MMX 指令定义了在一个寄存器的所有元素上同 
时执行统一操作。例如 ， PADDB (字节并 行加） 指令对8个独立的字节执行8个加法，而 
PADDW 对4个字同时执行4个加法^对于一个简单的操作如显示一幅简单的基于字节的图像， 
数据处理的速度会是使用普通8位操作的8倍。 

8.5.3 超标置体系结构 

如前面所讨论的 （5.2.5 节），另一个重要的并行指令技术涉及流水线阶段的复制，甚至是 
整个流水线的 复制。 流水化的难点是保持各阶段的平衡，如果执行一条指令比取指令花的时 
间长得多，就应将执行的后续阶段重复设置。初期的 Penthmi 使用80486的5段流水线，伹是复 
制了关键阶段，建立了双流水线，称为 U 流水线和 V 流水线。指令可以轮流在这两条流水线之 
间执行，如果两条流水线无障碍，甚至两条同时执行。更一般地，超标量体系结构具有多条 
流水线或者在流水线的特定阶段有多个执行部件用来处理不同种类的操作（如同早期 ALU 和 
FPU 之间的区分，这里只是部件更多了）。 

Pentium 的后期模型，从 Pentium n 开始，还在继续扩展。特別指出 ， Pentium n 的译码阶 
段1 ( ID 1) 或多或少地被复制了三次。理论上，这意味着 ID 1 阶段要花费其他阶段的3倍时长 
却没有显著减慢整个流水线。实际上，情况非常复杂。第一个指令译码器能处理中等复杂的 
指令，而第二和第三个译码器只能处理非常简单的指令。因此， Penthnnn 硬件包括一个特殊 
的取指令阶段，它将重新排列指令使其与译码器匹配*所以，指令队列中紧邻的三条指令如 
果其中之一是复杂指令，就自动将其放在译码阶段1。由于这些复杂的指令非常少见，没有必 
要考虑给第二和第三个译码器增加这种（昂贵）能力。最后，对于非常复杂的指令，还有第 
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四个译码器，微码指令序列器 （ MIS )。 

在执行阶段还有一个硬件单元的复制。流水线的一个特殊阶段，重排缓冲器 （ ROB )， 接 
受指令并且将指令分发到多达5组不同的执行单元。这些单元处理多种指令，例如，载入指令, 
存储指令，整型操作（分为“简单”和“复杂”类型），浮点指令（也有类似划分），以及一 
些不同的 MMX 指令。 

8.6 再论 RISC 与 CISC 

已经花了几章来描述 RISC 和 CISC 体系结构之间的区別了，你可能已经注意到实际的区别 
很小—— ( RISC ) Power 芯片和 （ CISC ) Pentium 两者采用很多同样的技术来获得机器的最大 
合理性能。竞争使得两个集团都愿意采用对方好的思想，这是一部分原因。更重要地，随着 
技术的改进，系列本身变得模糊了。摩尔定律表明放在适 度容釐 微晶片上的晶体管密度以及 
电路数置正以非常快的速度变得越来越大。反过来，这意味着即使“精简”指令集芯片也能 
有足够的电路包含常用的指令，即便这些指令是复杂的。 

与此同时，硬件已经足够的快，允许非常小规模的软件仿真传统的硬件功能。这个方法， 
称为微程序设计，意味着在 CPU 中用其自己的微指令集创 JiCPU 。 一条复杂的机器指令—— 
例如， 8088 /Pentium MOVSB 指令将字节串从一个单元移到另一个单元一可以在微指令级实 
现，通过特有的微指令序列，每次移动一个 字节。 宏指令将被翮译成数 fi 可能很多的微指令 
序列，这些微指令来自于程序员不可见的微指令缓冲区，每次执行一条。 

这个翻译是 Pentium 超标董体系结构中 ID 1 译码器的工作 • 第二和第三个译码器只能将指 
令翻译成简单的微指令，第一个译码器能够处理更加复杂的指令，产生多达4条微 指令。 对于 
更加复杂的指令， MIS 作为査找表保存多达上百条微指令，这些微指令针对干 Pentium 指令集 
中真正复杂的部分。 

在一个 更加迨 学的层面上，具有讽刺意义的是 Pentium (正如所实现的）是一个 RISC 芯片。 
各类执行单元核心中的独立微操作正是严格 RISC 设计核心的小规模、快速的操作。 RISC 的主 
要不足——它需要精致的编译器来产生合适的指令集合——不是由精致的编译器/解释器进行 
处理，而是利用 CISC 指令集作为近乎中间表达层进行处理。用髙级语言编写的程序被编译成 
CISC 指令集可执行文件，然后，在执行时再被策新转换成 RISC 类微指令。 

8.7 本章回顾 

• Intel Pentium 是一个芯片系列——世界上最著名并且最杨销的 CPU 芯片。部分归于有效 
的市场营销，部分归干前期类似芯片如 x 86 系列的成功 ， Pentium (以及第三方克隆 
Pentium , 如 AMD 芯片）已经被确立为基于 Windows 和 Linux 的计算机选择的 CPU 芯片。 

•一方面作为 CISC 设计的产物，另一方面作为对遗留的改进以及向后兼容， Pentiuni 是一 
个复杂的芯片，拥有庞大的指令集。 

•可用的操作包括通常的算术操作（乘和除有专门的格式，并使用专门的寄存器），数据传 
送，逻辑操作，以及一些其他专用操作捷径。整个8088指令集都可用，支持向后兼容。 

• Pemium 包含大量专用指令以便支持特别的操作。例如， ENTER / LEAVE 指令支持程序类 
的操作，源于编译髙级语言如 Pascal 和 Ada 。 

• Pentium II 提供了一组多媒体 （ MMX ) 指令，用来支持简单算术操作的指令级并行。 
MMX 指令集支持 SIMD 操作——例如，同时执行8个分开的独立加或者逻辑操作，而不 
是每次只执行一个操作。 
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• Pentiimi 也吸纳了广泛应用的流水化和超标量体系结构，提供真正的 MIMD 并行。 
•Pentium 的实现包含 RISC 核，在此， CISC 指令是用 RISC - 类微指令实现的。 

8.8 习题 

1. 8088和 Pentium 之间有哪四个主要不同？ 

2. 指出 Pentium 中含有但8088中没有的4条指令。 

3. 为什么 Pentium 有两个译码阶段，但是只有一个执行阶段？ 

4. SIMD 并行如何使计算机屏幕上光标/指针平滑移动？ 

5. Pentium II 中重排取出的指令的目的是什么？ 
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9.1 背景 


微控制器是在设备内部用于小规模控制操作的特种计算机，人们通常不认为微控制器是计 
算机。这类设备的经典案例包括交通灯、烤箱、恒温器以及电梯，但是更好的、更细致的类型 
是现代汽车中安装的微控制器。例如，防锁死制动由微控制器监视制动系统并且当车轮锁死时 
(汽车会 打滑） 切入。微控制器的其他用途包括引煨气囊、调节燃油混合器减少排放，等等。 
根据 Motorola (—家微控制器厂商），仅低端2002型客车就包含了 I 5 个微控制器，一个具备更 
好的娱乐和安全特性的豪华轿车通常有100多个微控制器。这些数字一直以来都在增长。 

没有关于微控制器的正式定义，但是它们通常有三个主要特征。第一，它们通常用在所 
谓的嵌入式系统中，作为一个大系统的部分运行特定的单用途代码，而不是通用可编程的计 
算机。第二，它们往往是小型、功能较少的计算机 。 （Zilog Z 8 Encore ! 微控制器使用8位字， 
运行频率 20 MHz , 只能访问 64 K 的存储器，大约卖$ 4 。与之相比， Pentium 4 处理器能够轻松 
地卖到$250以上，而且仅一个裸处理器——没有存储器无法单独使用。）第三，微控制器通常 
是单芯片器件，它们的存储器和多数外设接口都位于同一个物理芯片上。这在目前很胯通， 
因为几乎所有现代计算机体系结构都有位于 CPU 芯片上的 pche 存储器。其货要意义在于一个 
微控制器可用的存储器根据定义就是全部 cache 存储器，因此虽然容*小但是速度快。 

在本章，我们将详细 i 寸论 Atmel 公司生产的 AVR 微控制器。当然， AVR 不是这类计算机中 
的唯一，微控制器是个商品部件，销《：数以亿计。这个领域竞争非常激烈，其他制造并销 ft 
微控制器的公司包括 Microchip 、 Intel 、 AMD 、 Motorola 、 Zilog 、 Toshiba 、 Hitachi 和通用仪 
器。然而 ， AVR (或者，吏楮确地， AVR 系列，因为有基本 AVR 设计的若千变形）在其能力 
方面非常典型，但是与主流芯片如 Pentium 或者 Power 芯片（分別由 Inte 〖和 Apple / IBM / 
Motorola 制造）在令人关注的方面又有所不同。 


9.2 组织和体系结构 
9.2.1 中央处理单元 

考虑到速度和简单性两方面 ， Atmel AVR 采用 RISC 设计原则。相对很少的指令使得指令 
长度短 U 个字节，相比之 PowerPC 指令的4个字节， Pentium 的指令多达15个字节）并且执行 
速度快。每条指令都限制在16位标准长度，其中包括必要的参量。指令集针对微控制器通常 
的需要而定，包 括大* 用干对单一电气信号操作的位指令。尽苷这样，仍然有130条不同的指 
令（比〗 VM 少）。 AVR 的指令集甚至也不是最小的， Microchip 制造了一个相对普通的极小芯 
片一用在烤箱上——只有不到35条指令。 

Atmel AVR 包含32个通用寄存器（编号从 R 0 到 R 31)， 还有64个 I / O 寄存器。这些寄存器每 
个都是8位宽，对于单一字节或者0〜255 (或者 -128 - 127) 之间的数来说足矣。如同 JVM ， 
一些寄存器能够成对使用，以便允许访问大一点的数。不寻常的是（至少与我们已经学过的 
计算机相比），这些寄存器是物理存储器的一部分，而没有与存储器芯片分离（如图 9-1 所示)。 
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FLASH 存储体 
( 代码存储） 


SRAM 体 
( 短期数据存储 ) 


EEPROM 体 
( 长期数据存储 ) 


图 9-1 AVR 体系结构图。特别注意哈佛体系结构（多个分离的存储块) 
以及不是在 CPU 中而是在存储器中保存的通用寄存器 


考虑所有的实际用途， AVR 不支持浮点数， ALU 只对整型进行操作，并且是非常小的 
整数。 

从操作上， AVR 与我们已经了解的计算机非常相似，有专用指令寄存器、 PC 、 栈指针， 
等等。 

9.2.2 存储器 

因为 AVR 是微控制器，所以 AVR 上的存储器是非常受限的。与以往不同， AVR 的存储器 
被分成3个独立存储体，这3个存储体不仅在物理特性上不同，而且在大小和容董方面也不同。 
确切的存储器容量依型号的不同而不同，但是 AT 90 S 2313 的容量很有代表性。这个机器，如 
同多数微控制器，是哈佛体系结构设计的范例，这里分开的存储体（和分开的数据总线）可 
以用于机器指令和数据。借助两个不同路径，每个存储体都能独立地调整发挥其最大性能。 
更进一步，计算机能同时载入指令和数据（通过两组总线），有效地加倍其速度。但是对于通 
用计算机，一般也要求两个分开的 cache 存储器（一个用于指令，一个用于数据），这反过来 
减少了每个存储器可用的 cache 容量，于是严重地损害了 cache 的性能。在微控制器上，存储器 
就是全部的 cache , 不存在上述影响。 

在 AVR 中，有三种分开的存 储体： 一个用于程序代码的只读存储体（因为程序代码在程 
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序执行过程中不应该被改变），一个用于程序变量的高速可读/写存储体，第三个存储体用于 
长期保存程序数据，这些数据必须在断电时还能够保持（例如，日志或者配置信息）。不像传 
统的体系结构，所有存储器基本上是相同的并且以单一虚拟地址空间来满足任何访问 ， AVR 
三个存储体中的每一个都是独立组织并且用它们自己的地址空间和指令来访问。 

正如前面讨论的 ， ROM (只读存储器）和 RAM (随机访问存储器）之间存在一个根本的 
区别，可以从 ROM 中读，但是不能向 ROM 中写，而 RAM 既可读又可写。这个区别在理论上 
比实际上更重要，随着多种类型存储器的发展，要求大 M 设备可涂写（一种抽象的、柏拉图 
的、昂贵的意识）。实际上， ROM / RAM 区別的现代定义是使用上的 不同： 无论 CPU 能否写入 
存储体。在 AVR 中，第一个存储体由 FLASH ROM 构成。尽管 FLASH 在理论上是读/写存储器 
(它是通常用作移动驱动盘的存储器），但是 AVR 中没有向其写入的电路和指令。从 AVR 的角 
度， FLASH 存储器提供（在 AT 90 S 2313 上， 2 CH 8 字节）非挥发存储，断电时也不丢失信息。 
该存储器，用于所有只读用途，以16位字方式组织，保存可执行的机器代码。特别地， PC 中 
保存的值就是用作指向该存储块的字地址。 AVR 芯片自身不能对 ROM 进行任何改变， ROM 只 
能由人们借助合适的外部设备（说实话，设备并不贵）对其重新编程。 

相比之下，第二个存储体既可读又可写。这个数据存储器由 SRAM (静态随机访问存储 
器）构成。正如补充资料中讨论的， SRAM 和 DRAM (动态随机访问存储器）之间的主要区 
別是动态 RAM 要求计算机电路给出周期性的“刷新”信号以便保持所存的值。 AT 90 S 2313 的 
SRAM 容最为 256字节。 

既然存储器基本上是由垴快数据存储电路构成，就不再需要单独的高速寄存器体，如典 
型计算机中的寄存器。 AVR 数据存储器组织成一个 S 位字节序列，分成三个子体。前32字节/ 
字 （0 x 00"0 xlF , 或者使用 Atmel 记法为 $00..$1 F ) 用来作通用寄存器 R 0.. R 31 。接下来的64个 
字 （0 x 20“0 x 5 F ) 用来作64个 I / O 寄存器，其余的 SRAM 提供一组通用的存储器储存单元，用 
于记录程序变最和/或栈帧。这些存储器储存单元使用从 0 x 60 开始直到 SRAM 的锒髙地址进行 
访问 （ AT 90 S 2313 SRAM 的最高地址是 OxDF )。 

最后，第三个存储体使用另一类存储器， EEPROM . 如同 FLASH ROM , EEPROM 是非 
挥发的，所以关闭电源后数据也一直保存。与 SRAM 类似， EEPROM 是电可编程的，因此 
AVR CPU 能向 EEPROM 写数据，并且数据能够永久保存（尽管这需要很长时间，以 4 ms 的数 
tt 级）。与 SRAM 不同的是，数据被写入的次数有限（大约100 000次，尽管技术一直在改进）。 
这是存储器构造的物理问题，编写 AVR 程序时应该记住这一点。每秒向 EEPROM 存储体只写 
一条数据并且只写一次，一天多一点的时间就会达到100 1000次的写限制。然而，计算机能 
够从 EEPROM 安全地读，并且没有读的次数限制。这使得 EEPROM 是理想的保存现场可修改 
数据的存储体，这里的数据需要保存但是不用经常修改，例如启动/配置信息或者不频繁的数 
据日志（比如，每小时一次，这样能记录大约10年>。在我们的例子中， EEPROM 存储体容置 
为128字节。 

这些存储体每个都有其自己的地址空间，因此数字0 (0 x 00) 不仅能指实际的0也能指 
FLASH 存储器的最低2个字节， EEPROM 的最低（单个）字节，或者 SRAM 的最低字节（即 
R 0)。 与所有的汇编语言程序一样，解决这个二义性的关键是上下文 I PC 中保存的值指向 
FLASH 存储器，而普通寄存器的值（当被读作地址时）指向 SRAM 中的单元。对 EEPROM 的 
访问通过专用硬件，实际上可将 EEPROM 视为外设。 
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补充资料 

存储器类型 

玫瑰到底还是玫瑰，但是存储器不只是存储器。我们已经讨论了几种不同的存储器一 
例如， RAM 和 ROM 之间的不同。广义讲，工程师们总是讨论不同种类的存储器，每一种 
都有其适应的用途。 

• RAM ： 随机访问存储器。这是最常用的存储器类型，人们听到存储器时就会想到 
的，二进制值被当成电信号保存。毎组信号集合（通常集合是字或字节尺寸，也可 
以是单独的位）可以“随机”的次序被独立地访问，因此得名。 RAM 是一种挥发性 
存储器.它需要电源来保持信号，如杲断电， RAM 中所有的信息都会消失。 

RAM 又分为两种 类型： 动态 RAM ( DRAM ) 和静态 RAM ( SRAM )。 你购买或者看 
到的大多数存储器是 DRAM , 它比较便宜并且小巧。每个“位”保存的只不过是一个电容 
中的电荷（另有一个相关的晶体 管）. 电容在短时内保持能量。 DRAM 的问题在于存储器 
电路内部的电荷衰退，即使芯片本身有电源。只要计算机有电 SRAM 就会记住保存的值而 
不需刷新。实际上，这意味着计算机必须周期地产生刷新信号来重建 DRAM 存储模式。 
(“周期地”在这个上下文中意味每秒几千次。这对于 1 GHz 的处理器来说仍然是一个相当 
长的时间间 隔。） 

与之相比， SRAM 是自增强的，像附录 A 中讨论的触发器电路。每个存储位的建立一 
般需要6~ 10个晶体管.这意味着一个字节的 SRAM 存储在芯片上要占用大约10倍的空间， 
并且成本也高达10倍。另一方面， SRAM 不需要刷新周期，所以它可更快地访问 。 DRAM 
通常用来做主存储器（这里几百兆字节的额外成本会累加），而 SRAM —般用于小型、速 
度关鍵的存储应用，如计算机的 cache 存储器。（出于这个理由. Atmel 微控制器只用 
SRAM 傲它的可写存储器，还不到1000字节.速度因索超过了价格因索 J 尽管 SRAM 是 
自刷新的，晶体管也需要电涿才能工作，如果电源被切断时间过长（以毫秒计） SRAM 的 
信号就会丟失。因此， SRAM 仍被认为是挥发性存储器 # 

• ROM ： 只读存 储器。 RAM 既能够读出也能够写入.而 ROM 芯片不能被写入。更准 
确的描述是必须要写入 ROM 芯片时， f 要特殊的 操作. 有时甚至是特殊的设备。然 
而， ROM 的优势在于它是一种非挥发存储器，意味着如果从芯片断电，数据仍能保 
持。这使得它成为理想的存 储器，例如. 存储数码相机拍摄的照片。 

ROM 最简单又古老的组织方式类似于 DRAM , 但是不使用电容，每个存储单元包含一 
个二极管，由芯片厂商对其逬行编程，仅当存储单元包含1时才允许电流通过。由于二极管 
不需要电源，而且一般不会消蚀.构建在芯片中的模式永远保持不变 • 除非你踩踏或诸如此 
类的破坏。另外，厂商必须确切地知道要用的存储值是什么，如果厂商改变了决定或者出了 
差错，后果是非常严重的。 （1993 年 Pemhrnifdlv 浮点除 bug 就是 ROM 出错的一个示 例。） 

可以非常廉价地大量生产 ROM —每个芯片几美分。但是，如果你只需要 2 5个芯片 
会怎样呢？为此可能就不值得收买整个芯片制造厂。取而代之，使用 PROM (可编程的 
ROM ) 芯片会更好。像 ROM 芯片 一样. PROM 是通过对每个存储单元（不是主动元件. 
如晶体管）静态电连接而成。在 PROM 中这些连接实际上是融丝，通过施加足够高的电压 
可以将融丝熔断。这个过程被形象化地称为“烧制” PROM 。 PROM —旦被 烧制. 保持的 
电气连接（或者是断开）就始终固定不变了。因为不可能再愈合融丝.所以 PROM 只能被 
烧制一次。 
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ROM 最后一种形式避免了这个问題 。 EPROM (可擦写可编程 ROM ) 芯片对于存储元 
采用先进的董子物理创立基于半导体的可重用融丝。为了建立一个电气连接，存储单元也 
要像 PROM —样接受过电压。然而.应用紫外线光照几分钟之后，“融丝”就会复原。这 
将擦除整个芯片，允许重新编程以及重新使用。 

•混合存储器经过获取两方面最佳性能的努力，制造商已经开始生产所谓的混合存储 
器，混合存储器是电场可编程的，同时还具有 ROM 的存储优势。 EPROM 技术的一 
个变形，如 EEPROM (电可擦除可编程 ROM ) 芯片，使用本地电场“擦除”每一个 
存储单元而不是作为一个整体将芯片全部 擦除。 由于这个操作是通过电子手段执行 
的， EEPROM 不需要紫外光箱，是个独立部分。 

另一方面，写 EEPROM 要花很长时间，因为存储单元必须暴露在磁场下擦除，这要花 
费若干毫秒。在理论上， EEPROM 与 RAM 提供同样的功能，因为每个存储单元都可以写、 
读以及改写，但是计时（以及成本问題）使它并不实用^ EEPROM 的主要问题在于它们 
一般只有有限数 t 的读/写周期。 

FLASH 存储是加速写入 EEPROM 过程的一种方法。其基本思想很简单，电场不是单 
独擦除毎个位，而是擦除芯片的大块。擦除一个块与擦除单个位的用时几乎相同，但是在 
必须大量保存数据时（比如.在一个笔驱动上，像我钟爱的 Jump Drive 2.0 Pro , 由 Lexar 
Media 制造），向存储器传输一个数据块的时间超过了擦写所放置区域的时间。 FLASH 存 
储器已被广泛地使用.不仅用于笔驱动，也用儀数码相机存储器、智能卡、游戏控制台存 
储卡以及 PCIMCIA 卡内的固态盘。 

混合存储器的另外一个变形是 NVRAM (非挥发 RAM ), NVRAM 实际上是携带电池 
的 SRAM 。 当电源断开时，电池能够供电使得 SRAM 芯片中的存储单元保持通电。当然， 
电池的成本使得这种存储器比简单的 SRAM 要赍得多 # 

•SAM (顺序访问存储器不提到 SAM . 对存储器类型的讨论就是不完全的。直觉 
上任何曾经要在录影带上找出某个情景的人都会熟悉 SAM 。 与 RAM 不同， SAM 只 
能以特定（顺序）的次序访问.这使得小数据董的使用慢得可怕。多种辅存一 
CD - ROM 、 DVD 、 硬盘,特别是磁带一实际上都是 SAM 设备.尽管它们一般提供 
块级的随机访问。 


9.2.3 设备和外设 

AVR 实现了一种简单的存储器 -I/O 映像。这一设计并不是面向图形量大的环境，在那里人 
们也许期待以每秒多达20至30次的速度显示由上百万字节组成的画面。取而代之，它只求驱 
动一个芯片，而这个芯片的输出通过几个引脚物理地（而且电气地）附加到 CPU 电路。具体 
地，这些引脚是可寻址的，通过 I/O 存储体中特别定义的 单元对 其进行寻址。例如，写入 I/O 存 
储单元 0x18 (SRAM 存储单元 0x 38) 被定义成写入“端口 B 数据寄存器” （ PORTB ), 这等价 
于端口 B 第八个输出引脚设置一个电气信号。这个芯片有足够的能源点亮一个简单的发光二极 
管 （LED), 或者启动一个电气开关来接通高压电源给更多的用电设备供电。类似地，读取寄 
存器不同的位能使 CPU 检测引脚当前的电压，或者检测一个光电池是否对光有反应，或者判 
定从外部传感器读来的当前温度。 

AVR 提供若干双向数据端口，这些端口能被单独地定义（基于每个引脚）成输入或输出 
设备。 AVR 也提供片上计时电路，可以用来测董经过的时间和/或让芯片对有规律的循环发生 
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的行为采取措施（如每30秒改变红绿灯或每毫秒读一次发动机的温度）。取决于型号，会有一 
些嵌入的外设如用于大规模数据发送/接收的 UART (通用异步收发器），用来比较两个模拟传 
感器读数的模拟比较器等。与大型计算机不同，许多输出（引脚）由几个不同的输出设备共 
享，用于 UART 的引脚与用于数据端口 B 的引脚在物理上是相同的。没有这种重#,芯片在物 
理上将会非常难用（有上百个引脚需要单独地连接），但是重叠本身意味着几个设备不能同时 
使用。如果你正在使用端口 B , 你就不能同时使用 UART 。 

I / O 存储器也是 CPU 本身当前状态信息的保存场所。例如， AVR 状态寄存器 （ SREG ) 位 
于 I / O 单元 0 x 3 F ( SRAM 地址 0 x 5 F ), 并且包含描述 CPU 当前状态位（如最近计算结果是否 
为0,或者负数）。栈指针保存在单元 0 x 3 D (0 x 5 D ) 并且定义该单元（在 SRAM 内）为活动 
栈单元。由于这些寄存器在编程上被当成存储单元来对待，与 I / O 外设打交道就如同读写存 
储单元一样。 


9.3 汇编语言 

像多数芯片一样， AVR 中的寄存器没有任何特别的组织 方式。 汇编语言指令用两参量格 
式编写，目的操作数曾是一个源操作数。因此 

ADD R0, Rl ; R0 - R0 + R1 

将 R 1 的值加到 R 0 中，结果在 R 0 中保存，置位 SREG 反映运算结果。令人迷惑的是，数字0 
和数字1与更易理解的 R 0 和 R 1 有冏样的作用——汇编器对两者都能接受。尽管表面上这非常 
像一条 Pentium 或 Power 的汇编语言指令，但它（当然）符合一个不同的针对 Atmel AVR 的机 
器语言标准， 

AVR 提供了我们希望的大部分普通的算术和逻辑类 指令： ADD 、 SUB、MUL (无符号乘）、 
MULS (有符号乘）、 INC 、 DEC 、 AND 、 OR、COM (按位求反，即 NOT)、NEG (补码 ）、 EOR (异或）， 
以及 TST (测试寄存器的值，如果该值为0或者是负数则设置相应的位）。也许我们会觉得奇怪， 
它不提供惮速昂贵的除法操作。取模操作也没有，而且不支持浮点。 

为了加速微控制器完成典型计算的速度，有一些-1变形指令 （ SUBI 、 ORI 、 AN 0 I 等等）， 
它们采用立即方式常数并且对寄存器进行操作。例如， 

ADO 0, 1 ; R0 - R0 + R1 

寄存器1与寄存器0相加。指令 

ADDI 0, 1 ； R0 = R0+1, 或者 ROIlfl 

将立即值1与寄存器0相加。 

也有一些指令执行单独的位操作：如 ， SBR (设罝寄存器中的位）或者 CBI (淸除 I / O 寄存 
器中的位）将设 H / 淸除一个通用寄存器或者 I / O 寄存器中的位。例如， 

SBR R0, FF ; R0 - R0 OR 0xFF 

将设置寄存器0的低8位为全1。 

控制操作也很多。除了转移/跳转指令（无 条件： JMP , 有 条件： BR ??， 这里？？指不同的 
标志以及 SREG 中的标志组合，以及跳转到子 程序： CALL ), 还有一些新的操作。 SB ?? 操 
作——第一个？可以是 R (通用寄存器）或 I ( I / O 寄存器），第二个？可以是 C (清除位）或 S 
( S 位），因此 SBIC = 如果 I / O 寄存器中的位清除就跳过下条指令——执行一个非常有限的条件 
转移，如果相应寄存器的位被设置/清除就跳过邻近的下一条指令。 AVR 也支持间接跳转（无 
条件： IJMP , 对于子 程序： ICALL ) 这里的目标位置取自寄存器（对），具体是保存在 
R 30. R 31 中的16位值。 
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9.4 存储器组织和使用 

—般的数据传送指令缺省对 SRAM 存储体进行操作。由于寄存器和 I / O 寄存器都是这个存 
储体的一部分，所以向寄存器写入和向一个简单的 SRAM 字节写入并没有区别。然而，前面 
一节中定义的算术操作只与通用寄存器 （ R 0.. R 31) 打交道，所以就必须准备着在这个存储体 
内来回地移动数据了。通常用于此目的的指令是 LDS (从 SRAM 直接载入），该指令第一个参 
撤是寄存器，第二个参董是存储单元，或与 LDS 相对的 SDS (直接存入 SDRAM ), SDS 的参量 
及处理都与 LDS 相反。 AVR 还提供3个特别的间接地址寄存器， X 、 Y 和 Z , 可用于间接寻址。 
这些是最后6个寄存器，成对使用（所以 X 寄存器实际是 R 26: R 27 对），用来保存存储器地址。 
使用这些寄存器和 LD (直接栽入）指令，代码 


CLR 

R26 

: 滴除 R26 (将其设置为 0) 

LDI 

R27. 0x5F 

;给 R27 教人立即值（常数值> SF 

LD 

R0, X 

••将 （X) [»5F 单元中的值]移人 R0 


将存储单元 Ox 005 F 中的值拷入寄存器0中。它首先将 X 寄存器的两个部分单独设置为 0 x 00 
和 0 x 5 F ， 然后将 X 用作索引寄存器（我们前面已经知道 0 x 5 F 实际上是 SREG 寄存器）。做这件 
亊更简单的方式是使用 IN 指令，该指令从指定的 I / O 寄存器读取 数值： 

IN R0, 0x3F ;拷贝 SREG 至 RO 

注意，尽管 SREG 在存储单元 0 x 5 F , 它只在 I / O 端口 3 F . 

使用 LPM (从程序存储器 栽入） 指令能间接地访问 FLASH 存储器（只能读出不能写入）。 
寄存器 Z 中的值用作存储器地址，指向程序 （ Hash ) 存储区，相应的值被拷入 R 0 寄存器。 

访问 EEPROM 要难得多，主要由于物理和电子的原因。尽管 EEPROM 存储体在理论上可 
读/写，但是写入会造成对存储体的物理 改变。 因此，需要花很长时间完成，并且痛要大量的 
前期准备（尤如发动“电泵”以提供必要的能源进行存储体内容更改），这些准备工作需要在 
写操作之前进行。 AVR 设计者选择更接近于类似访问设备的存储器访问模式。 

AVR 定义了3个 I / O 寄存器 （ SRAM 中 I / O 寄存器体的一部 分 ）： EEAR ( EEPROM 地址寄存器）， 
EJEDR ( EEPROM 数据寄存器）和 EECR ( EEPROM 控制寄存器）。 EEAR 包含一个与访问地址 
一致的位模式（在我们的标准示例中，该值在0到127之间，所以最高位应该总是0)。 EEDR 包 
含要写入的数据或者是已读出的数据，无论哪种情况都用 BEAR 中的数据作为目的地址。 

EECR 包含3个控制位，这些位单独地启用对 EEPROM 存储体的读或写访问。特别地， 
EECR 的位0 (最低有效位）被定义为 EERE ( EEPROM 读启用）位。要从 EEPROM 给定位置 
读，程序员应该采取以下 步骤： 

• 将要访问的字节地址栽入 EEAR 。 

•设置 EERE 为1，允许读。 

•读出数据。 

•读操作完成后，在 EEDR 中找出所需数据。 

写入的步骤有些复杂，因为有两个启用位需要设置。位2被定义为 EEMWE ( EEPROM 主 
写启用）位,当该位被置成1时， CPU 允许向 EEPROM 写人。然而，这实际上并没有进行写， 
这只是做了写的前期准备。真正的写是在 EEMWE 已经被置为1 ,然后通过将位1 
( EEWE / EEPROM 写启用位）置为1之后才开始的。经过一段短时（约四条指令的执行时间） 
之后， EEMWE 将自动返回0。这个两阶段提交任务的过程能防止计算机在程序出现 bug 时意外 
地改写 EEPROM (破坏重要的数据）。 

为了向 EEPROM 写入，程序员应该 
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• 将要访问的字节地址载入 EEAR 。 

•将新数据载入 EEDR 。 

•设 SEEMWE 为1，允许向 EEPROM 存储体写入。 

• (四个时钟周期之内）设置 EEWE 为1,允许写入开始。 

•写入数据。 

然而，实际写入可能会相当地慢，要花大约 4 ms 的时间。对于一个以 10 MHz 运行的芯片而 
言，这段时间足以执行40 000 (!) 个其他操作。由于这个原因，最好不要将 EEPROM 写放 
在中间（即一个可能的当前写完成之后等待 EEWE 位变为0)，在 EEPROM 操作之前，把能做 
的都做完。 

9.5 接口问题 


9.5.1 与外部设备的接口 

前面描述的 EEPROM 接口与其他外设接口非常相像。每个设备都由 I / O 寄存器体内定义的 
寄存器控制。几个例子就足以表明这种交互。 

AT 90 S 2313 提供了一个作为嵌人设备的 UART 来驱动标准串口。我们将忽略电气连接的物 
理细节，虽然这很有趣，但是它将把我们带到电气工程的领域，而不是计算机体系结构。 
CPU 与 UART 通过4个寄存器进行硬件 交互 ： UART I / O 数据寄存器（保存要被发送或者已经接 
收的数据）， UART 控制寄存器（控制 UART 的实际操作，例如，启用发送，或者设 S 操作参 
数）、 UART 波特率寄存器（控制数据传输的快/慢），以及 UART 状态寄存器（显示 UART 当前 
状态的只读寄存器）。要通过 UART 以及串行线路发送数据，首先将要发送的数据栽入到 
UART I / O 数据寄存器，然后将所需速率的表示模式载入到 UART 波特率寄存器。为了执行数 
据传送， UART 控制寄存器一定要被设 * 成“发送启用”（严格地说，就是 UART 控制寄存器 
的位3—定要 被置成 1)。如果在发送的过程中出现错误， UART 状态寄存器的相应位就会被 S 
位，而计算机能够观察到，并且采取适当的校正措施。 

与数据端口的交互涉及类似的过程。与 UART 不同，数据端口可配 置成允 许多达8个独立 
的电气信号同时传输。使用该系统，单一数据端口就能同时监视3个按钮（作为输入 设备） 和 
一个开关（作为输入设备），还能控制4个输出 LED 。 每个数据端口由两个寄存器控制，一个 
(数据方向寄存器）用来定义每个位是控制设备输入还是控制设备输出，而另一个（数据寄存 
器）保持相应的值。要开启与（假如说）引脚6连接的 LED , 程序员首先应该确认数据方向寄 
存器的第6位被（配置该引脚为输出设备），然后设置数据寄存器的第6位为】，给该引脚高 
电压（约3〜5伏），开启 LED 。 通过设 S 该引脚电压（接近）至0伏，并且设置这个位为0,将 
会关掉 LED 。 


补充资料 

时钟、时钟速率和定时 

计算机怎么知道几点了？更重要地，它们怎样确保需要同时发生的事情（如寄存器中 
所有的位同时加载）确实能同时发生？ 一般的回答都会涉及控制时钟或者定时电路。这不 
过是一个简单电路，通常挂上一个晶体振荡器（像数字钟里的那个振荡器）。这个振荡器 
每秒振荡几万亿次.每次振荡都被捕获作为一个电信号，并被送往所有的电子器件。技术 
上，这就是计算机描绘的 1.5 GHz 的来源，这个计算机中主时钟电路产生一个 1.5 GHz 频率 
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信号 • 换句话，每秒振荡1 500 000 000次。正如附录 A 中所见，这个时钟信号允许进行所 
需计算，防止寄生噪声引入错误。 

对于需要反复执行的动作，如每秒刷新屏幕30次，一个受控从电路只要计数（在此情 
况下）50 000 000主时钟周期，然后刷新屏*即可。显然，那些需要快速发生的工作，如 
取指一执行周期，需要尽可能短的计时，理想的是以毎时钟周期一次的速率发生 。 UART 
控制器的波特率就由类似的受控从电路控制。“速率楔式”告诉这个电路在 UART 必须改 
变信号之前应该发生多少个主时钟嘀嗒。 

这也是超频工作的原理。如果你有一个处理器设计在 1.5 GHz 运行， 可以调整主时钟 
电路（也许甚至更换振荡晶体）运行在 2.0 GHz 。 CPU 不知道信号到达得太快，它将努力 
进行高速响应。如果真正以每个时钟周期进行一个取指-执行的速率运行， CPU 将尝试更 
快地取指令.执行。从某种意义上.就像以超出常速放唱片一样 （45 转/分而不是30转/分）。 
(可以问问你的父母。）有时这样是可行的，你能廉价地得到30%速度提升。另一方面， 
CPU 也许不能响应这么快的速度，它也许就非常可怕地伴止了（例如，如果徼热不够充分）。 
有时 CPU 会超越其余的部件（要求数据快传而存储器巳无法满足它，或者总线无法如此快 
的传输）。 


9.5.2 与定时器的接口 

AVR 也包括一些内 g 定时器以便处理通常的任务，如度 ft 时间，或者以规则间隔执行一 
个操作。（想像一个 电梯： 开门，电梯等待一个固定的秒数，然后门再关上。只有〗亳秒的开 
门是无用的。）槪念上，这些定时器非常 简单： 一个内部寄存器设 S 为一个初始值。然后这个 
定时器统计时钟脉冲（每次给这个内部寄存器加 1), 这个脉冲要么取自内部系统时钟，要么 
取自外部定时脉冲源，直到内部寄存器“转了一轮”计数从全1到全0。此时，定时器响起， 
所计时间已到。 

有一个例子放在这里很适合。假设我们有一个时钟脉冲源，每 2 ns 来一个脉冲。给一个8 
位定时计数器栽入一个初值6,每嗝2叫计数器将会增至7, 8, 9,…。经过250次这样的增加 
(500叫大约1/2000秒），计数器会转到256,这会溢出使寄存器为0。此时，定时器向 CPU 发 
出信号，指示时间已到，以便 CPU 去做它在等待的事。 

一种常用并且篥要的定时器就是看门狗定时器，其目标是防止系统死锁。例如，一个写 
得很差的烤箱程序可能会有 bug , 它可能在加热功能打开之后就陷入了无限循环。这种无限循 
环的结果会烧了你的烤箱，很可能还有你的桌子、你的厨房，甚至你的公寓大楼。看门狗是 
一个普通的定时器工作，只是它发送给 CPU 的信号等价于按下重启按钮，重新启动系统使之 
处于一个已知（淸醒）状态。要由程序负责周期性地重置看门狗，以防止其触发。 

尽管定时器本身很简单， CPU 的行动就没有这么简单了。 CPU 与定时器以两种方式交互。 
第一，哑方式， CPU 把自己放在一个循环中，轮洵相应的 I / O 寄存器，査看定时器是否已完成。 
如果定时器还没有完成， CPU 就返回循环的开始。遗憾的是，这种连续轮询（有时称为忙-等 
待）的方法防止了 CPU 完成其他更有用的处理。忙-等待过程可以认为是坐在话机旁等待一个 
重要电话而不是把握你的生活。 

一个更智能的方式处理期待的未来事件（也适于坐等电话）就是建立一个中断处理器。 
这有些类似 AVR 如何处理期待却不可预测事件的方式。 AVR 可以辨识几种中断，这些中断都 
是在硬件定义环境下产生的，如定时器溢出，规定引脚上的电气信号，甚至是开机。对于 
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AVR 而言，给定芯片的可能中断号从0开始到一个很小的值（如10)。中断向量内这些编号与 
FLASH ROM (程序 代码） 中的单元相对应，当中断号0出现时， CPU 将跳转到 0 x 00 单元并且 
执行存放在那里的代码。中断号1将跳转到0 x 01，等等。通常，中断单元内保存的只是一条 
JMP 跳转指令，它将控制转移到一个更大的代码块上，这些代码才是真正执行中断任务的。 
(特別地，看门狗定时器产生与重启按钮或者加电事件同样的中断，由此可以提供保护，防止 
无限循环和其他程序 bug 。） 


9.6 设计一个 AVR 程序 


作为最后一个案例，这里给出一个设计（不是全部的代码），展示一个微控制器程序在实 
际中是如何工作的。第一个结论，微控制器是相当专用的计算机，因此存在很多种程序，以 
至于为微控制器编写程序有些傻。 AVR 的物理组织给出了一些明显的警示。例如，在一个没 
有 FPU 或者浮点指令的计算机上，编写涉及很多浮点计算的程序是非常愚蠢的。然而，对于 
其能力范围内的程序而言， AVR 是一个非常好的芯片。 

作为一个半实际的案例，我们来看一种运行在微控制器上的软件——具体地，关于一个 
典型的繁忙交叉路口交通灯设计。假设一条：11：/南方向的街道横穿一条东/西方向的街道，城市 
交通设计者想要确认毎次只有一条街道的交通予以通行。（假设通常红/黄/绿模式，分別意味 
停止、注意和通行。） 


为了让这个系统工作起来，提出4个不同的 模式: 


模式号 

北/南灯 

东/西灯 

注释 

0 

绿 

红 

北/南通行 

1 

黄 

红 

北/南缓慢通行 

2 

红 

绿 

东/西通行 

3 

红 

黄 

东/西缓悛通行 

实际上，这也许不能工作。出于安全的考虑， 

在交通从北/南到东/西切换期间，我们也许 

想要设置所有交通灯为红，使十字路口空闲，反之亦然。为防紧急情况出现，也需将所有灯 
置为 红灯。我们可以增加额外三种 模式： 

模式号 

北/南灯 

东/西灯 

注释 

4 

红 

红 

:«：/南即将通行 

5 

红 

红 

东/西即将通行 

6 

红 

红 

紧急 


这个列表产生了另外两个结论。第一，程序必须做的就是模式之间的迁移（通过合适的定时)， 
迁移的次序： 0,丨，5, 2, 3, 4, 0,…。第二，如同许多其他的微控制器程序一样，这个程序 
没有真正的停止点。只在这种情况下，程序以无限循环的方式运行不仅是有用的，也是必须的。 

编写这类程序最简单的方式是实现所谓的状态机。这个程序的“状态”是代表交通灯显示模 
式的编号（如，如果状态是4,所有的交通灯应是红色)。每个状态能保持一定的时长（由定时器 
度量)。当定时器中断发生时，计算机将改变状态，然后重新启动定时器以便度量下一段时间。 

在这个状态表中，我们也可使用其他的中断。例如，可以加入一个警察专用开关与一个 
引脚连接，对应一个外部中断。对于这个中断，中断处理器将被写入计算机要进入的具体状 
态，如所有交通灯变红的紧急状态。当那个开关被合上时（由警察按下按钮），控制器将立即 
执行这个中断。类似地使用外部中断能导致计算机检査是否有行人按下“步行”按钮，致使 
计算机迁移到另外一个状态，此时相应的步行灯亮起一段合适的时间。当然，我们可用看门 
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狗定时器来寻找可能的程序 bug , 必要时启动它（比如每次灯改变） ； 万一看门狗定时器触发 

时，我们可以让程序进入到一个指定的预先编制的普通状态或者是紧急状态，实际上此时有 

些方面出错，系统需要进行检査。 

9.7 本章回顾 

•微控制器是一个小型、单芯片、能力有限的用干小规模操作（如设备控制或者监视）的 
计算机。 

•微控制器用在很多小器具或设备上，这些看起来根本就不是计算机，如汽车的制动系统。 

•Atmel AVR 是相关的微控制器系列，具有专用的指令集。 AVR 体系结构与典型的全方位 
计算机体系结构有显著不同。例如， AVR 不支持浮点操作，包含少于10 000字节的存储 
器，但是对板级外设有广泛的支持。 

•像很多微控制器一样 ， Atmel AVR 是 RISC 处理的一个范例。机器指令数董相对很少，具 
有专用性。 ■ 

• AVR 是哈佛体系结构的一个范例，其存储器被划分为多个（这里是3个）不同的体，每 
个都有不同的功能和访问方式。 AVR 的寄存器（和 I / O 寄 存器） 位于3个存储体之一，还 
有专用 RAM 用来存储变 AVR 有一个 FLASH ROM 体用于保存程序，以及一个 
EEPROM 体用来存储静态变 ft ， 这些静态变 ft 在断电时也要保留。 

• Atmcl AVR 的输入和输出通过存储体内的 I / O 寄存器完成。一个典型设备有一个控制寄 
存器和一个数据寄存器。被读出和写入的数据放在数据寄存器中，对控制寄存器中的位 
进行的操作号要发生的动作相符合。不同的设备有不同的寄存器以及不同的操作。 

• 使用中断和相应的中断处理器可以有效地处理不常出现但期待的事件。当一个中断发生 
时，通常的取指-执行周期改成转移到预先定义的位 S , 在此处采取针对中断的具体行 
动。这种中断并不局限干 Atmel AVR , 而是发生在大多数计算机上，包括 Pentium 和 
Power 系列 。 

•由于硬件和能力的限制， AVR 只对于某类程序来说是个好的芯片。一个典型的微控制器 
程序是永远运行（以无限循环的方式）的状态机，以一个固定的，预先定义的次序执行 
一组已经定义的行动（类似干改变交通灯）。 

9.8 习题 

1. 微控制器的三个典型特征是什么？ 

2. 为什么 Atmel AVR 在设计中采用 RISC 原則？ 

3. 哪种典型的计算机部件在 Atmel AVR 中却没有？ 

4. Atmel 是冯诺依曼体系结构的实例吗？为什么？ 

5. RAM 和 ROM 之间的区別是什么？ 

6. 为什么 SRAM 比 DRAM 每字节的成本要高？ 

7. Atmel AVR 的存储体是什么？它们的用途如何？ 

8. 看门狗定时器的功能是什么？ 

9 “存储器 - I/O 映像” 的含义是什么？ 

10. 描述 Atmel 所用的让 LED 反复暗亮的过程。 

11. 如果我们想要交通灯在紧急模式下红-暗-红-暗…闪烁，如何修改交通灯示例？ 
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10.1 复杂和派生类型 

10.1.1 对派生类型的需求 

到现在为止，对计算的讨论都是集中于在基本的类型如整数和浮点数上的操作。但多数 
问题，尤其是大型或复杂的问题，需要计算机关注非 基本类 型上的操作。例如，要回答“从 
巴尔的摩飞行到旧金山的最便宜路线是什么？”这个问题，你就需要了解 肮班、 路线及金额。 
金额的表示与浮点数密切关联，而路线的表示则与一序列的起始点和停止点密切关联。 

从软件设计者的角度看，如果问题的解用高级类型给出的话就容易理解得多，而计算机 
却只能在其指令集范围内对基本类型进行操作。派生类型的槪念很好地填补了这个鸿沟 。一 
个派生类型 (derived type ) 是一个建立在基本类型之上的复杂类型，使得可在其上执行高阶 
计算。 派生类型“金额”从一个浮点数直接违立（或者更精确但不那么直接，可以从各种单 
位的整数组合建立，这些单位包括美元及美分，或者是英镑、先令、便士以及历史上使用过 
的法新 h 派生类型“地理位 S ” 可由两个分別表示纬度和经度的数字直接建立。 

像 “路线” 这样非常抽象的槪念可由“地理位 S ” 之间的“航班”的“链表”途立，每 
个航班与表示为“金额”的成本相关联。在这个例子中，“路线”就是派生类型。而“链表”、 
“航班”、“金额”以及“地理位 S ” 也是派生类型，它们烺终作为原始类型的适当组合而进行 
存储和操作。从软件设计者的角度看，如果这样的类型可在计算机系统本身内实现，而且如 
果程序员能使用这些高级操作的计算机实现，这就是一个很大的优势。派生类型使得程序员 
和系统设计者能够以比建立单块程序更容易的方式建立复杂的系统。 

10.1.2 派生类型的一个 例子： 数组 

理论 

最简单和最常用的派生类型之一就是数组 ( array ). 从理论 fe 与平台无关的角度看，数组 
就是由一个整数来索引的一组相同类型的数据元素。如果必要的话，你可以用这个定义来表 
示数据结构课程班级的某个人。同时，让我们再进一步解释一下：一个数组就是有时被称为 
“容器类型”的一个例子，容器类型的意思是其唯一的用途就是存储其他信息块以备后用。在 
一个数组中，所有的信息块必须是同一数据类型，如必须都是整数或都是字符。当然，它们 
可以有不同的值。最后，数据的各个位置用一个数，也就是指定了该特定元紊的一个整数来 
寻址。看来还不坏！见图10-1。 

short figure [ ] =： new short [5); 

如果你有一个 1000 个整数的数组，那么要占用多大的空间呢？假设是4字节整数，那么理 
所当然就需要至少4000个字节。不管使用哪种机器都是这样的。然而，这样大的一块存储块 
不可能装入到一个寄存器中。幸运的是，这不成问题，因为计算要在单个数据元素上而不是 
在整个数组上执行。这样，程序员就能采用一个策略来得到数据。程序员可相对于数组的基 
地址 ( base ) 来存储数据，该位置也就是数组访问的起始点。在本例中，它对应至少4000字 
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”的 存，，通常是数_起始元素 （ G 号元素） 的存 ㈣ 址。程序■雜— 个偏移 
( offset ), 就是他或她想要使用的元素的整数 索引。 在8088或奔腾中， 这 些数要存储在 两个不 
同的寄存 S 中， -个 特定的存職式告附情肋浦 它纖适继合 ㈣ 问 数组。 



图 10-1 显示一个数组的存储布局情况的示窻图 

在 JVM 中，情况有点不同，因为 4 •地址 槙式”不真实存在 # 实际情况是，两个数被压入 
到堆栈并执行特定的操作，以此来正确地访问数组。实际上，根据要作什么，有 5 种特定的操 
作。大致根据需要程度，这些操作依 次是： 

•创建一个新的 数组， 

• 向数组的一个元素装入一个数据项 | 

• 从数组的一个元素取得数据 | 

•确定数组的长度， 

• 当不再需要一个数组时将其销毁。 

更重要的是要注意，从高级语言程序员的角度（或从计算机科学理论家的角度）来看， 
这两种方法之间没有真正的区別。其原因是数组在本质上是由其用法定义的派生类型。只要 
有执行这些动作的某种方式（例如，向特定索引的数组元素装入一个值），从理论角度^具体 
实现是无关紧要的。这一点在讨论类时还会谈及。 

创建 

显然，数组必须在使用之前创建。计算机需要保留适量（可能很大）的存储块。在像 C ++ 
或 Pascal 这样的高级语言中，这通常是在数组变量声明时自动完成的。请见下面 语句： 
int sample[1000] ; 

该语句声明 Tsample 是一个保存了整数 i m 类型元素的数组变量，并同时保留了能保存从 
[0】到[999】这 1000 个整数的足够空间。在 j ava 中，数组的空间是通过显式地数组创建来保留的， 
比如： 
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int[] sample - new int[1000]; 

这里有点区别。在第一个例子中，数组的创建隐含在声明中。而在第二个例子中，数组 

的创建（存储块的分配）是通过显式的命令 （“ new ”） 来实现的。 JVM 当然不支持一般意义上 

的变董声明，但却支持数组创建。这是通过使用机器语言指令 newarray 来完成的。为了创建 

一个数组，程序员（及计算机）需要知道要创建的数组大小及其所包含元素的类型。 

指令 newarray 接受单个参数，就是数组元素的基本类型。在这方面汇编器有点奇怪，因 

为它需要的是类型的 Java 名字而不是类型表达式。例如，要创建前面定义的数组，类型就是 

而不是类型表达式 I 。要创建的数组的长度作为整数必须在堆栈上得到。该长度将被弹 

出，会为有适当长度和类型的新数组预留空间，然后对应于新数组的地址将压入到堆栈的顶 

部。这个地址可以适当地装入和处理。 

JVM 定义前面数组的方法 如下： 

ldc 1000 ; 将 1000 作为新数组的长度压入 

newarray int ； 创建- 个轅数数组 

astore 1 ; 将 新数组 存储到 #l\vspace*(-4pt| 

数 组是* 本类型 byte (字节）和 char (字符）实际使用的地方。在进行堆栈计算时，字 
节和字符值自动转换为整数，而在局部变董中它们仍然是32位的量。这有点浪费空间（最多 
每个局部变*浪费3个字节，一个微小的数釐），但这比使 JVM 存储很小的量浪贽空间要少。 
当数组变大时浪费的空间可能会相当大。事实上， JVM 甚至为布尔 ( Boolean ) 数组提供一个 
基本类型，因为机器可选择在一个字节中存储多达8个布尔值（对于字则是32个），这样就将 
空间效率提髙了 95%以上。 

从技术上说， newarray 指令（操作代码 OxBC ) 只创建基本类型如整数和浮点数的一维数 
组。派生类型数组的创建要更复杂一些，因为还要定义类型。由于派生对象是由程序员有些 
随意定义的，不存在也不可能存在所有可能派生类型的标准列表。 JVM 为创建派生类型的一 
维数组而提供了一条 anewarray 指令（操作代码 OxBD ) # 如前所述，数组大小必须从堆栈弹出， 
而类型是作为一个参数给出。然而，参数本身相当复杂（下面要讨论到实际上是指描述元 
素类型的常 tt 池中的一个字符串常 ft。 从 JVM 的角度看，执行操作代码 OxBD 要比执行 OxBC 
困难得多，因为它要求 JVM 在常 ft 池中査找这个字符串，解释这个字符串，检验它确实有意 
义，并有可能加栽一个全新的类。从程序员的角度看，创建一个基本类型的数组和创逮一个 
派生类型的数组之间差异很微小，对像 jasmin 这样的汇编器的一个可能的功能增强就是允许 
计算机（通过检査#数的类型）确定需要的是操作代码 OxBC 还是 OxBD 。 

创建派生对象的数组的最困难部分是定义类型。例如，要创建一个字符串类型的数组 
(见下面），就必须使用完整的类型名 M java / lang / String \ 下面的例子显示出如何创建1000个 
字符串的 数组： 

ldc 1000 ；数组中有 1000 个元素 

anewarray java/lang/St ring ;创途一个字符申数组 

这个特定的指令非常不寻常而且是 JVM 所特有的。大多数计算机不在指令集的层次上提 
供这类分配存储块的支持，甚至更少的计算机支持有类型块分配的思想。然而，支持有类型 
计算的能力，甚至当所涉及的类型是由用户定义时，对于 JVM 设计者所预想的跨平台安全性 
尤为关键。 

除了创建简单的一维数组， JVM 还为创建多维数组提供了一条快捷指令。 
multi anewarray 指令（注意拼写有点复杂）从堆栈弹出变化的维数，并生成一个适当类型的 
数组。 multianewarray 的第一个参数以类型表达式的快捷表示定义了数组的类型（应注意， 
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不是数组元素的类型），第二个参数定义了维数，也因而定义了需要弹出的堆栈元素的数； M ；。 
例如，下面的代码就规定要从堆栈弹出3个数，生成一个三维 数组： 

bipush 6 ；在第三维的数组大小 = 6 

bipush 5 ; 在第二维的数组大小 = 5 

bipush 3 ; 在第一维的数绗大小 = 3 

multianewarray [[[F 3 ； 生成一个 3 x 5 x 6 的浮点数组 

注意，最终生成的数组有三维，总大小为3 x 5 x 6。第一个参数 u UlF n 将最终数组的类 
型定义为三维浮点数组 （3 个[)。 

类型系统扩展 

从先前对 System.out 和打印各种内容的讨论中，你应该对系统如何对 JVM 表达类型有所了 
解。 表 10-1 的上半部分列出了常见的基本类型（这些类型用在 newarray 指令及 JVM 表达式中， 
并可能在对1心01^7汁1：1^1或_11；13^^7的调用中用到）。除了我们已经熟悉的那些基本计算 
类型， JVM 将字节 （ B )、 短整数 （ S )、 字符 （ C) 以及布尔 （ Z) 也看作是基本类型，这些也 
列在表 10-1 中。 

派生类型正如所料是由底层类型的表达式派生出来的。例如，一个数组的类型描述就是 
一个起始方括号（【）后跟数组中每个元素的 类型。 注意，不需要结束方括号，事实上也不允 
许。这已经让不止一个程序员感到困惑 • 整数数组的表达式就是[ I ，而一个二维浮点数组 
(矩阵）的表达式就是 [[ F , 这在字面上表达的意思 就是： 一个数组 （[>, 其中的每个元素都 
是一个浮点数组 （[ F )。 


表 10-1 类型描述表达式 


类型 

JVMdasmin 表达式 

整败 (ini) 

I 

长整败 (long) 

J 

浮点数 (float) 

F 

双 W 度数 （ double) 

D 

字节 (byte) 

B 

短整数 (short) 

S 

字符 (char) 

C 

布尔 （ boolean) 

Z 

void ( 返回类型） 

V 

X 类型的数组 


类 Y 

LK, 

接受 X 返回 Y 的函数 

(r)r 


类和类类型用完全限定类名来表达，前面有一个大写的 L ， 后面有一个分号（;）。例如， 
系统的输出 System.out 就是一个 PrintStream 类的对象，存储在 java.io (或 java/io) 目录和包中。 
这样， System.oiu 的正确的类表达式就是 Ljava / lo / PrlntStream ;， 这在前面的很多例子中已 
经用过了。 

这些类的构造函数可根据需要结合起来以表示复杂的类型。例如，标准 Java 对 “main” 
例程的定义要接受一个字符串数组作为#数。在 Java 中，写作如下的一行 代码： 
public static void main(Stnng [] args) 

String 是系统在 java.lang 包中定义的一个类，所以会表示成 Ljava /〗 ang / Strlng ; ，而参数 
就是这种 String 的一个数组。这个 main 方法不对调用环境返回任何值，因此声明的返回类型是 
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void。 以下是我们熟悉的迄今在很多方法前面都出现的 语句： 

.method public static main([Ljava/1ang/String;)V 

该语句声明了 main 方法接受一个 String 的数组作为唯一的参数而不返回任何值 （void)。 
从这个例子显然可以看出，这个类型系统不仅用于描述数组类型，而且还用于方法的定义, 
这将在后面讨论。 


存储 

要存储数组的一项， JVM 根据元素的类型提供了若干个类似的指令。为简单起见，暂时 
假设是整数的数组（[0。为了在数组中的一个位置存储一个值， JVM 需要知道3件亊情：哪 
个数组、哪个位 S 以及哪个值。程序员必须将这3个值（以这个次序）压入到堆栈上，然后执 
行指令 iastore 。 这个操作有点不寻常，因为它不向堆栈压入任何东西，所以其纯粹效果就是 
将堆栈大小减小3。 

图 10-2 给出的简单例子显示出如何将数据存储到数组。这个代码片断首先创建一个10个 
整数的数组，然后将数0~9存储为相应的数组元素（图10-3)。 


bipush 10 
newarray I 
astore_l 


偌要 10 个元素 
创达一个10 个轚数 的数组 
将数组存储到位* 参1 



；装入一个0,准条循环 
;并存储到《 


Loop ： 


aload.l 

iload_2 

iload_2 



iinc 2 1 



bipush 10 
if_icmplt Loop 

, 我们做完了！ 


装 入数组 
装入位 K 

装入值 《与 位贤一样） 

Warray [位* ]=* 值 
将1加到 *2 (位 K 和值） 

我们做完了吗（位 ff>10 吗）？ 

到 Loop 再重复 


ffllO-2 在数组中存储的例子 




0x3004 

0x3008 



0x3010 

0x3014 

0x3018 

0x30lC 



图 10-3 图 10-2 的存储布局 
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对于其他的基本类型，包括并非用于计算的字符和短整数， JVM 采用在首字母定义变化 
形式的标准方法来提供适当的类型。例如，要在一个长整型数组中存储一个元素，可使用 
T ^ store ^ f 。 要在数组中存储一个非基本类型（地址类型，如数组的数组或对象的数组）的 
元素，元素就存储成地址 （ a )， 所以指令就是 aastore (见表10-2)。唯一竦手的是布尔类型 
的数组和字节类型的数组，两个都用 b 字母打头。幸运的是， 】 VM 本身能处理这个二义性，因 
为它对字节数组和布尔数组都用 bastore 指令，并且能自行区分。（的确，这里撒了一个小谎。 
在大多数的 JVM 实现中，尤其是来自 Sun 微系统公司的实现，机器不用费心去区分，因为它就 

是使用字节来存储布尔数组的元素。这导致每个布尔元素大槪浪费7位，但在效率上仍是可接 
受的）。 


表 10-2 装入和存储值的数组操作 


数组元素类型 

存储操作 

装人操作 






















布尔 （ boolean) 



数组 < 地址） 



对象 《地址） 




存储一个多维数组必须通过一个存储序列来完成。由于一个多维数组实际上存储成（并 
视为） 数组的数组，首先必须装入相关的子数组，然后在子数组内进行装入和存储。图 10-4 
显示出一个将数100放入到整数矩阵中的一个梢（这里 是位置 【1】[2】）的代码 片段： 


bipush 3 

第二维的维数是 3 

bipush 4 

第一推的维数是 4 

nujltianewarray [[12 

生成 4x3 的整 数数组 

astore_l 

将数虮存到 

aload.l 

装 入数组 

iconst.l 

我们感兴趣的是 a[l][?] 

aaload 

得到 a[l] ( 一行 3 个 整数〉 

iconst_2 

得到位 》2 

bipush 100 

装人 100, 要放人到数组 a[l] 

iastore 

将 100 存储到 a[l][2] 


»110-4 多维数组的创建和存储的例子 


装入 

装入和存储的原理一样。 JVM 提供一组? aload 系列的指令，用来从数组中取出一个元素。 
要使用这些指令，就要压入数组和期望的位置。指令将弹出这些参数，然后提取出存储在那 
个位置上的值并压入，如下 所示： 

装入存储在 #1 的 1000 个整数的数组 
压入值（就是期望的位置 > 56 
提取出 array[56 ] 的整数并压人 


bipush 56 
iaload 
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获取长度 

获取一个数组的长度是容易的。 arraylength 指令弹出堆栈（当然必须是一个数组）的第 
一项，并压入数组的长度。例如，下面的代码就装入先前创建的样例数组，获得其长度，并 
将整数值1000留在堆 栈上： 

aload.l ; 装人先前定义的样例 （ 1000 个整数的数组） 

arraylength ; 弹出样例，压入样例的长度 

销玫 

与前面的操作不间，不再需要一个数组的内容时销毁该数组非常简单。 JVM 标准的定义 
是，机器本身应该定期地进行垃圾收集 （garbage collection ), 寻找程序不再使用的存储空间、 
类实例以及变董。一旦发现，就回收并使之可再使用。 

对于垃圾收集例程的楕确定义和操作，各种 JVM 实现各有不同。“垃圾”的一般定义是程 
序不再能达到的存储位置。例如，如果局部变置#1装有一个数组（是数组地址的唯一拷贝）， 
则该数组及其内部的每个元紊都是可达到并可用于计算的。如果程序员要对局部变量#1进行 
写覆盖，则虽然数组本身没有变化，但不可能再访问其内部的信息了。从这一点看，该数组 
所占用的存储空间（可能很大）不再存储任何有用的东西，就要回收另做他用。唯一的问题 
就是没有办法精确地预测这种回收可能在什么时候发生，而 JVM 的实现不完成任何垃圾回收 
在技术上也是合法的。 

从程序员的角度看，没有必要明确地销毁一个数组。弹出或者写覆盖对数组的所有引用 
(这在程序正常运行过程中经常自动发生），就会导致数组变得不可达到，成为垃圾，并因而 
被回收。 


10.1.3 记录： 没有方法的类 
理论 

下一个最简单的类型称为结构 ( structure ) 或者记录 （ record )。 与数组一样，这是一个容 
器类型。与数组不一样的是，存储在记录中的数据包含在命名的域中，并可以是不同的类型。 
记录提供了将相关数据一起保存在一个逻辑位置上的 BascballPlaycr^ 


方法。如果愿意，你可以将一个记录看作是一个电子 
棒球交易卡，里面携带了所有与一个球手相关的信息 
(击球率、本垒打次数、上场击球次数、击球跑垒得分、 
盗垒数，等等），这些信息以一致的、易于传输的格式 
存储（见图10-5)。这些信息的每一个部分都与特定的 
域名关联（例如， “ RBI ” 表示击球跑垒得分 h 并有 
不同的类型（击球率定义为浮点数，本垒打次数是整 
数，而位罝 “ shortstop ” （游击手）甚至是一个字符串）。 
一个更简单的例子是有两个整数域（分子和分母）的 
分数。 



与数组不同，每个记录的类型必须在编译时由程序员分別定义。定义主要由一列必要的 


域名及其各自的类型所组成。这些都存储在一个看上去很熟悉的文件中，如图 10-6 所示。 


这个例子程序显示了记录类型的一个简单实例，就是分数（或者数学家也可能将其看作 


是有理数）。分数形式上被定义为两个整数的比值，这两个整数分别称为分子（在顶上的数) 


和分母（在底下的数）。在这个文件中的两个关键行就是用 . field 汇编指令开头定义了这两个 
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域。比如，见下面 一行： 

.field public numerator I 



图 10-6 —个将 fraction 定义为派牛类型的记录样例 


该行定义一个名为 numerator 的域，其值是“ I ”类型（如前所述， I 代表整数）。一个域 
如果其值是长整数型 （ long ) 就用 “ J ”， 如果其值是字符串型 ( String ) 就用表达式 
tt Ljava / lang / String ;\ 这些我们前面已经看到。 public 关键字指出分子值是 “ public ”， 意思是 
它可以被系统中的其他函数和其他对象访问、读以及修改。 

文件的其余部分是什么意思？仔细观察你会发现，从类定义的第一个例子开始，我们用 
的都是同一个样板。其原因很简单：记录在 JVM 中被实现为一个类，所以要使系统的其余部 
分能与新定义的记录相互作用，就必须也要有一个 * 小的类开销。现在没有其他问题了，让 
我们特别地将类看作是派生类型并了解其优点。 

10.2 类和继承 

10.2.1 定义类 

编程技术（或者更准确地说是程序设计技术）锒主要的进步是面向对象 ( object - 
orientated ) 编程技术的发展。在这个框架下，大型程序的设计是通过采用较小的交互式对象 
(interactive object ) 系统来实现的，这些对象独立地负责自己的数据处理工作。一个常用的比 
喻是餐馆。就餐者可点他莒欢的任何菜肴而无须关心做菜的细节，那是厨师的任务。（厨师也 
无须关心是谁点了某个菜，那是服务员的任务）。这种责任的划分确有好处，因为为某个用途 
编写的代码片段常常能重新用干其他的用途，而大型系统若看作是一组相互作用的对象来建 
立就相对容易。作为重复使用的例子，在 3.4.1 节设计的随机数生成器就可在任何需要随机数 
的时候使用，不管是做蒙特卡洛模拟、还是维加斯赌博游戏、或者是第1人称枪战游戏。 

为了将这些对象结构化，形成一致的框架，通常将它们分组并写成类 （ class )， 类就是具 
有类似性质的对象。两个随机数生成器在很多方面是相同的，即使具体的参数或操作可能不 
同。特别是，外部的观察者想要对随机数生成器所做的事情（确定种子使之达到一个开姶生 
成随机数的状态，或者从生成器得到一个新的随机数）是相间的。这样我们就可以从操作的 
角度来定义“随机数生成器”这个槪念，也就是说，不是根据它如何工作而是根据我们如何 
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对其操作来进行定义。任何自称为随机数生成器的东西都要完成这两个操作。 

这就得到一个熟悉的类的形式化定义，就是将类 （ class ) 定义为派生类型的抽象描述， 
该派生类型由一组命名的（而不是编号的）并有不同类型的域所组成。（听起来是不是很像是 
记录？）。不同之处是类还包含方法 （ method )， 即定义了与该类交互的合法方式的函数。最 
后，一个对象 ( object ) 是一个类的示例或实例化，所以如果将类看作是一个抽象的槪念（如 
“汽车”），对象就是一个特定的汽车，如我过去在髙中常常使用的那辆老式的 VM Bug 。 

快速回顾一下，（从外部来看）类就是将对象聚合起来的一种方式，这些对象具有类似的 
性质，我们可用相同的方式与其打交道。在一个正在运行苹果的 OS X 操作系统的计算机上， 
所有的窗口在左上角都有三个 按钮： 红色按钮用于删除窗口，黄色按钮用于使窗口变为图标, 
绿色按钮用于使窗口扩大。一旦用户掌握了如何与任何•^个窗口打交道，她就能与所有的窗 
口打交道。这个思想被推广形成类、对象以及方法的槪念。特別是，每个对象（也就是类的 
实例）共享相同的方法，即所定义的与该对象交互作用的函数。如果你了解了如何驾驭一辆 
VMBug , 你就能驾驭所有的 VM Bug , 因为驾驭的“方法”是相同的。 

在 JVM 上编程时，这种观点同样适用，因为两个对象表示成类文件的独立实例，每个类 
文件在很大程度上是独立的，并依赖于相同的方法在 JVM 字节码层次上进行通信。我们在前 
面的程序中已经看到这样的例子，多是在与系统输出进行交互。 

详细情况如下： 

• System .out (在 jasmin 中是 System/out) 是一个特殊的对象。 

• System/out 实例化了 java /1 o/PrintStream 类。 

• 所有的 PrintStream 对象都有一个 prlntln 方法。 

• primln 方法能使一个字符串出现在“通常”的位置，对于不同对象可以改变这个位》。 
对于 System / out , 它出现在诸如屏幕的标准输出中。 

•要做到这一点，可使用 Invokevlrtual 指令来触发适当对象 ( System / out ) 上的适当方 
法 （ primln ) [并且还要以适当的类型 （ PrimStream ) 】• 

每个系统都要求（通过 Java / JVM 标准文档）提供一个 PrintStream 类以及一个 System / out 对 
象作为该类的成员。具体的细节（例如，是打印到磁盘文件，还是打印到屏#窗口，还是打 
印到打印机）由单独的类确定。而且，速立另一个将其数据打印到不同位置的对象是件容易 
的事情。这样，要打印到文件而不是到屏幕，你可以不调用 System / out 的 primln 方法，而是调 
用新对象的相同方法。 

Java 不强迫使用面向对象的编程，但为这种语言设计的结构使得使用面向对象编程更容 
易而且更有利。另外， JVM 的结构也不强迫使用面向对象的编程，伹确实鼓励使用面向对象 
编程。特别是， JVM 明确地将可执行文件存储成类文件 （class file )， 正如所见，这使得利用 
交互作用的类建立大规模系统非常容易。我们在下面给出这种派生类的一些例子。 


10.2.2 —个简单 的类 ： String 

类与数组和域一样是派生类型，但类定义所包括的各种方法使其难理解得多。派生类型 
的一个典型但相对容易理解的例子是标准的 j ava String 类，定义为 Java.lang (或 Java / lang ) 包 
的组成部分。 String 类简单地保存一个不可改变的字符串，如 “ Hello , word ! ”，这个字符串 
也许就要被打印。这个类定义了在一个 String 中要用到的数据类型（通常是字符的数组），也 
定义了一组方法、函数及操作，它们是与 String 类进行交互作用的合法途径。我们一直都在使 
用 String 对象却没有对其性质有一个正式的了解。 
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使 用一个 String 

除了存储具体的字符串值， String 还支持大置的计算方法，用来检査 String 以确定其性质。 
例如，方法 charAt () 的功能就是接受一个整数并返回其所指定位置的字符。 

在 Java (或者一个等价的面向对象的高级语言）中，这个函数将被定义成适合调用的方 
式，就像如下 所示： 

class java.lang.String { 
char charAt(int )； 

} 

这个既用于定义也用于调用的方案指出，方法 charAtO 是类 String 的一部分 （ String 本 
身又是 java/lang 包的一部 分）， 它接受一个整数作为参数并返回一个字符值。在 jasmin 中，同 
样的这些槪念将用稍微不同的语法来表达，也就是用在表 10-1 给出的语法来表达。 

java/lang/String/charAt(I)C 

(快速 复习： 这行的意思是符号 “ charAt ” 是一个函数，它接受类型 I 并返回类型 C 。） 我 
们将会看到，这类语法既用于定义方法本身也用于针对任何特定的串调用方法。 

compareToC )方法的功能是比较当前 String 与另一个 String 以确定哪一个字母顺序优先。如 
果 this (指当前串）比参数 String 在字典中靠前，即可能更短或者某字符在通常的排序中更綠 
前，则返回的就是一个负整数。如果 this 比 String 参数更靠后，返回的就是正整数。如果两个 
String 正好相等，则返回0。在 jasmin 表示法中，这个方法表示 如下： 

java/1ang/String/compareTo(Lj ava/1ang/String;)I 

属于 String 类的其他方法还 包括： equalsO 的功能是返回一个布尔值以指示两个串是否相 
等， EquaUIgnoreCaseO 的功能是做同样的判断但忽略大小写（所以 “ Fred ” 与 “ fred ” 不 
相等但 equalsIgnoreCase 将为 真）， 1 ndexOf () 的功能是返回作为参数的字符首次出现的位 
S « length () 的功能是返回 String 的长度 • toUpperCase () 的功能是返回一个新串，其中的 
所有字符都已经被转换成大写字母。总共有超过50种不同的方法，这不包括那些隐含地从 
Object 类继承来的方法，这些方法经由标准定义，成为 JVMjava . lang . String . cla.ss 的一部分。 

10.2.3 实现 String 

在底层以及在字节码级别， String 是如何实现的呢？答案虽然令人烦恼却是有意义的，那 
就是如何实现无关紧要！任何实现了必要的50种方法的合法 iVM 类，无论实际的细节如何， 
都是 String 类的合法版本。只要其他的类只使用定义明确的标准方法来与 String 类交互作用， 
用户就会发现表现很好的 String 类会满足他们的需要。 

例如，实现 String 的一个（没有价值的）可能性就是看作是对单个字符变量的有序收集， 
每个字符变量表示 String 中的单个字符。从程序员的角度看，这有一些明显的缺陷，因为他需 
要创建很多名字类似 seventyelghthcharacter 的变量。一个更好的解决方案是采用一个简单 
的派生类型，如一个字符数组（见前面）。即使在这里也还有一些选择。例如，为 了尽® 节省 
空间而采用字节数组（如果设计者预计要处理的 String 都是 ASCII 串，这样也就没有必要处理 
UTF -16 串了）。还可以使用整数数组以简化必要的计算。 String 可在数组中以正常顺序存储， 
使得数组的第一个元素对应于串的首字符：或者也可用相反的顺序存储，以简化 endsW 1 th () 
方法的实现。 

类似地，也可以选择是否创建一个特殊的域，用以将串的长度保存为整数值。如果采用 
这种做法，就会使每个 String 对象更大和更复杂一些，但也会使 length () 方法使用得更快一 
些。像这样的权衡取舍或许对于系统的总体性能是重要的，但对于程序员的 String 版本是否合 



系 10 章 JVM 高级编程问題 157 


法没有影响。其他任何人使用 String 类时会发现，如果所有方法都有且正确，那么他们的程序 
总会正确运行。 String 类文件与使用 String 的类文件之间没有必要存在特殊的关系。 

构追一个 String 

String 有一个特殊的方法，通常称为构造函数 ( constructor ), 可用来构造一个新的 String 。 
这个方法不接受参数，而且，由于生成的 String 是零长度且无字符，所以在大部分时间并无太 
大用处。用迄今本书所使用的符号，这个构造函数描述 如下： 
java/1ang/String/<init>()V 

为了更容易和更有用， String 类还有很多（大约11个）其他的构造函数，允许指定要创建 
的 String 的内容。例如，程序员可通过复制一个已存在的 String 来创建新的 String : 

java/1ang/String/<init>(Ljava/1ang/String;)V 

也可以从 StringBuffer (能从一个可变的字符串构造出不可变的字符串）创建一个字 符串： 

java/1ang/String/<init>(Ljava/lang/StringBuffer;)V 

或者直接从一组字符 创建： 
java/1ang/String/<init>([C)V 

其中的任何一个构造函数都对 String 的创建及其内容提供控制。 

10.3 类的操作和方法 

10.3.1 类操作介绍 

一般来说，类比数组要困难得多，因为要求类能够（或者至少允许）提供比数组更多的 
操作和更多种的操作。由于这个原因，随时创建一个新的类通常不现实（虽然总可以通过实 
例化一个现有的类来创建新的对象）。就像我们一直采用的做法，类是通过 .class 文件来定义 
的。类的基本性质，如域和方法，是通过 Jasmin 汇编指令在编译时定义的。这些域和方法一 
经定义，就可由系统上的任何人使用（要有适当的访问许可 

10.3.2 域操作 
创建域 

与数组不同，类中的域带有名字，而不是编号的。然而，不同类的域可能有相同的名字， 
从而可能引起模糊和混淆。为此，使用域时应该用全称描述，包括该域所在类的名字。 

要生成一个域， jasmin 使用汇编指令 .field, 如下所示（在图 10-6 中也有显 示）： 

.field public AnExampleField I 

这个例子在当前类中创建一个域，名为 AnExampleField ， 其中包含一个 int 类型的变最。 
由于这个类被声明为 public (公共）的，所以可被不属于该类的方法访问和操纵，假设程序员 
有某种理由要这样做。一个更现实的例子（延续前面的棒球示例）可见图10-7。 

.field 汇编指令允许有若干个其他的访问规范和参数。例如， 一 个域可声明为 final , 意 
思是其值不能由域定义中设定的值所改变》也可以声明为 static , 意思是该域与一个类而不是 
类内的单个对象相 关联： 

•field public static final double PI D = 3.1415926537898 

这个例子将包含; l 值的 “ PI ” 定义为静态的（面向类的）、最终的（不可改变的）双精度 
数。如果由于某种原因，程序员想要限制对 PI 的使用只能是该类内部的方法，就可将其声明 
为 private (私有）。有效的访问规范包括：私有 （ private )、 公共 ( public )、 保护 （ protected )、 
最终 ( final ) 以及静态 ( static ), 它们在 Java 内都有同样的意思。 




图 10-7 假想的 BaseballPlayer 类的域（见图 10-5 > 


使用域 

由于域自动就是其对象/类的组成部分，因此它们作为对象创建的组成部分（或者对于静 
态域，就是作为类加载的组成部分）被自动创建，而且当相应的对象/类通过垃圾收集被清理 
时这些域也被销毁。因此对于程序员来说，感兴趣的两个操作就是将数据存储到一个域和从 
域中取出数据（将其放到堆栈上)。 

存储到堆栈的过程类似于存储到数组的过程，主要的不同是域是命名的而不是编号的。 
这样， putfleld 操作就接受相关域的名字作为参数（因为这样的名字不能 被放置 到堆栈上）。 
程序员需要压入相关对象（其域将要被设 S ) 的地址以及（必须是正确类型的）新值，然后 
执行适当的 putfield 指令，如图 10-8 所示。（执行代码的结果显示于图10-9)。 



#1 应保存 BaseballPlayer 类的一个实例的地址（即 
娃类 Example 的一个对象 
明确地说 ， MBabe Ruth 


uth "; 压入 名字，该名卞 将被*于 Name 域中 
seballPlayer/Narae Ljava/1ang/String; 

； 歌新装入巧电 

； 将 1923 作数放人到域中 

；压入1923,将要放人到 Year 域中 
seballPlayer/Year I • 将1923作为整数放入到域中 

； * 新装人对象 

；在 1923年, Ruth 的击球率是0.393 
seballPlayer/BattingAverage F 

；将 0.393 作为 f? •点数放入到域中 



图 10-8 在对象域中存储信息 


由于静态类属千类而不是特定的对象，所以也有 

类似的结构，但不需要在堆栈上有一个对象，而是使 

用 putstatic 指令简单地 置于适 当的类域中。如果前 

面的 P 〖例子没有被定义成 “ final ”， 那么程序员只能 

通过下面语句调节 PI 的内 部值： 

ldc_2w 3.0 , 装入 3.0, 成为 PI 的新值 

putstatic Example/PI D i 对 Example 类的 PI 置为 3 

* 当然，这不可行，因为 PI 在前面被定义成 ‘final’ 了 

JVM 还提供了用于从域中取回值的指令 
( getfleld 和 getstatic )。 System 类(在 java.lang 中 
定义，因而正式地表达为 java/Iang/System) 包含一个 
静 态定义的名为 out 的域，这个域包含一个 primStream 对象。要得到这个对象的值，我们采用 


类 BaseballPlayer 



图 10-9 执行图 10-8 中代码的结果 
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下面已经熟悉的 语句： 

getstatic java/1ang/System/out Ljava/io/PrintStream 

由于 java / lang / System 是一个类，因此在执行 getstatic 过程中不需要堆栈上有东西，也不 
会弹出任何东西。当访问一个非静态域（使用 getfield ) 时，由于值必须从一个特定的对象 
中选出来，所以该对象必须首先被压入到 堆栈： 

aload_l ; 从 #1 装人 Example 对象 

getfield Example/AnExampleField I i 将 AnExaapleFleld 作为整数压入 


10.3.3 方法 

方法介绍 

除了域，大多数类还拥有方法，方法就是对存储于类或其对象中的数据的作用方式。方 
法与域的不同之处在于方法要执行计算，因而包含字节码。与域一样，有若干种具有不同性 
质的方法。例如，主要的方法必须几乎总要定义成既是 public 的又是 static 的，这是由 JVM 解 
释器工作的方式所要求的。当 JVM 试图执行一个类文件时，它要寻找一个方法来执行，该方 
法是类定义的一部分（不是任何特定对象的组成部分，因为静态类没有对象）。由于该类没有 
对象，这个方法就必须可公共访问。由于这个原因，我们迄今所写的每个程序都包括下面一 
行将 main 定义成 public 和 static 方法： 

.method public static main([Ljava/1ang/String : )V 

通过 Invokevlrtual 调用方法 

方法在其相应的类文件中声明和定义。要使用一个方法，就必须在适当的对象或类上调 
用。针对方法调用有一些基本的方法，这些方法根据具体情况以稍微不同的方式使用。 

调用方法的锒常见和锒直截了当的方式就是使用 Invokevlrtual 操作（操作代码为 0 xB 6)。 
我们在多个章节中一直在使用这种方式，没有特別新的内容，槪念上也不困难。这个操作从 
堆栈弹出一个对象（以及方法的参数），调用对象上的适当方法，并压入结果，如下面的标准 
代码 所示： 

getstatic j ava/1ang/System/out Lj ava/1o/PrintSt ream 

ldc "Hello, world!" 

invokevirtual java/io/PrintStream/println(Ljava/lang/String;)V 

这段代码将对象 System.out (—个 PrintStream ) 和一个参数压入。通过观察 
invokevlrtual 这一行，我们可以看到堆栈顶部必须包含一个 java / lang / String 类型的参数，并 
在其下包含一个 PrintStream 对象。一个更复杂的方法可能要接受若干个参数，但参数仍要在 
invokevlrtual 这一行指定，所以计算机能确切地知道要弹出多少个参数。在所有参数之下就 
是其方法将要被调用的对象（见图10-10)。 

当调用这个方法时，控制将以与子例程调用类似的方式传递到新方法。然而，还有一 
些极为重要的差别。首先，到方法的参数被顺序地置于从#1开始的局部变量中。局部变量 
#0得到的是其方法将要被调用的对象本身的一个拷贝（用 Java 的术语，就是#0得到 this 的 
一个拷贝）。新的方法还得到全新的一组局部变&和一个全新的（并且是空的）堆栈。 

当计算完成后，方法必须有返回，并且以方法定义所期望的适当类型返回。从调用环境的 
角度看，方法应该向堆栈的顶部压入一个适当类型的元素。从方法的角度看，它需要知道是 
哪个元素（以及什么类型）。有若干个命令用于返回，首先是不返回任何东西的 return ， 即其 
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aload 1 •• 装人类 Cl ass 的 Object 
bipush 3 
bipush 5 



invokevirtual Class/method (IIF)V 


5.0 

〆 -^ 


5 


新的 

3 


( 空） 

Object 


堆栈 





#0 : Object 



#3 


5.0 


WI0-I0 使用 invokevirtual 调用方法 


类型是 void , ? return 系列返回堆栈顶部的适当类型的元素。这个系列的成员包括 ireturn 、 
1 return , freturn 、 dreturn ， 以及用于返回一个地址或对象的 areturn (见图 KM1 )。 然而， 
这个系列不包括 ret 指令，该指令是从一个子例程返回。在方法的结尾“离开”也是不合法的。 
与 Java 和大多数髙级语言不同，在方法的结尾没有隐含的 return 。 

这一点可以从下面一个非常简单的方法中看出来，该方法当且仅当参数是整数3时 
返回1。 


.method public isThree(I)I 
.limit locals 2 
.limit stack 2 



bipush 3 
if.icmpeq Yes 
bipush 0 



参数 . 是 - 个餮数，在 #1 中 
装入 3, 为了比较 
如果 #1_ 画 3, 則返冋 1 
如果不相等 . 所以返回 0 


Yes: 


bipush 1 



; 相等，所以返问 1 


.end method 


子例程（通过 Jsr / ret 访问）和方法（通过 invokev 1 rt U al /? ret U rn 访问）有一个非常重 
要的差异。当一个子例程被调用时，调用环 境和被 调用例程共享局部变量和当前堆栈状态， 
而每次启动一个方法，你就得到一组全新的（都未初始化的）局部变置和一个全新的（空的） 
堆栈。由千每次新的方法调用都得到一个新的堆栈和一组新的局部变量，因此，方法以一种 
子例程没有的方式支持递归（方法调用自身）。要递归地调用方法，可以简单地使用存储在#0 
中的值作为目标对象，并正常地写 invokevirtual 这一行。当方法执行时，它将使用其自身的堆 
栈和局部变量而不影响主计算流程。当从方法返回时，调用环境可简单地从离开的地方重新 
运行，并使用方法调用的返回结果。 
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bipush 6 



bipush 1 



1 

〆 -〜 

* 

7.0 



6 

W St ny tx 

帧并将 i 压 人到调 
用帧 

调用栈 




10-11 采用 iretum 的方法返回 


其他 Invoke ? 指令 

由于 invokevlrtual 接受一个对象及其参数来调用一个方法，所以它（或许是显 然的） 不 
适干用干舴态方法。諍态方法没有相关的对象。 JVM 为调用类上的静态方法提供了一个特殊 
的 Invokestatic 操作（如图 10-12 所示）。这个操作与 invokevlrtual 非常类似，只是它不是 
试图从堆栈弹出一个对象，而是只弹出参数。它不用操心去将对象放入#0,而是用开始于#0 
的参数填充到局部变歎。 


< 1 n 1 t> 

bipush 3 
bipush 5 




新的 

( 空 ) 

堆栈 



图 10-12 使用 invokestatic 的静态方法调用 


还有一些特殊的环境需要特殊处理。特別是当要初始化一个新的对象（使用 <1 n 1 t > 方法）， 
或者要处理一些涉及超类和私有 （ private ) 方法的綵手情况时，就必须要使用一个特殊的操 
作 Invokespecial 。从程序员的角度看， invokevlrtual 和 invokespeclal 之间没有差别，但 
下面标准样板代码说明了 invokespecial 的主要用途。 
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.method public <init>()V 
aload _0 

invokespecial java/1ang/Object/<init>()V 
return 

.end method 

为了初始化一个（任意类的）对象，首先有必要确 i 人它有超类的所有性质（例如，如果 
Dog (狗）是 Animal (动物）的子类，要初始化一个 Dog ， 你就需要确认它是一个合法的 
Animal )。 这是通过调用当前对象 （ this ， 或者局部变董 #0) 上的初始化方法来完成的。但是 
由于它是一个初始化方法，计算机就不得不使用 Invokespecial 。 

声明类 

类通常在具有 . class 扩展名的文件中定义和声明。所以，这些文件就包含了关于类本身及 
它们与其他类之间关系的必要信息， JVM 需要这些信息以保证操作正确。 

由于这个原因，每个创建的类文件都需要有两个汇编指令来定义类本身及其在类层次中 
的 位置： 

.class Something 

.super ParentOfSomething 

像域和方法一样， xlassfr 编指令也有各种访问规范，如 public 。 类的名字（在上面例子 
中的 Something ) 应该是完全限定名，包括包的 名字。 作为 java . lang 包的一部分定义的类 
System 就包含完全限定类名 java / lang / System 。 类似地，超类应该包括直接超类的完全限定名， 
而且必须出现。虽然大多数学生写的类都是 java / hing / Object 的子类，但这不是缺省的，必须 
明确地给予指定。 

还有一些其他的汇编指令在类文件中可有可无，多数是用于源程序调试的汇编指令。例 
如， . source 汇编指令告诉 JVM 程序用来生成类文件的文件的名字。如果程序在运行过程中出 
错， JVM 解释器能使用这个信息来打印更多有用的错误消息。 

10.3.4 类的分类 

在上一节讨论中被掩盖的一个重要的微妙之处就是存在若干个不同类型的类文件和方法。 
虽然它们都非常类似（在存储上的实际差异通常只涉及设 置和淸 除类文件中访问标志的一些 
位）， 但它们代表了类语义方面的深刻差异，尤其是从类的外部来看。 

在类、对象以及方法之间的最通常的关系中，一个类中的每个对象有其自己的一组数据， 
但由一组统一的方法来操作。例如，考虑任何特定型号汽车的“类”（让我们特别考虑2007本 
田雅阁）。显然，这些汽车（在理论上）以相同方式操作，但它们在诸如颜色、油箱油鼉以及 
车牌号方面有各自的性质。这些性质在各个 Honda 对象中被存储成域。另一方面，每辆车的车 
前灯都用绝对同样的方式控制。打开车前灯的“方法”是类的一个特性，而不是某个汽车的 
特性。 

然而，存在某些作为类总体上的性质，如汽车的长度、轴距宽度以及油箱尺寸。这些性 
质甚至能直接从设计图中读出，不需要汽车实际存在。我们对两个槪念加以 区分： 类变量 
(class variable ) 是指类本身的性质，而实例变董 （instance variable ) 是指各个实例的性质。 
在 JVM 中，类变量的域被声明为 static 并被存储于类本身而不是存储于各个 对象： 

.field color Ljava/1ang/String; 

.field static carLength D 

类似地，域可被定义为 final 以表示其值（无论是一个实例变最还是一个类变量）不能被 
改变： 
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.field final vehiclelndentification Ljava/lang/String; = "whatever" 

.field static final wheels 1-4 
.field static final tires 1=4 

在这个例子中，域 vehicleldentification 是一个不变化的实例变量（但不同汽车的值可 
能不同），而这个类中的所有汽车都有相同固定不变的轮子数（见图10-13)。汽车的长度是该 
类的一个性质，而汽车的颜色是各个汽车对象的性质并可变化（比如你决定要重新喷漆的话)。 


类 ： Car 



图 10-13 类与静态域。所冇汽车郞有相冏数的轮 T , 佾毎个都有其 Q 己的颜色和牟 ( VIN ) 


实例方法和类方法之间有类似的区别。迄今所写的大多数程序都包括一个如下定义的 
方法： 

.method public static main([Ljava/1ang/String;)V 

这个 main 方法非常艰要，因为默认情 况是： 一旦 Java 程序运行（或者更准确地说是一个 
类文件用 java 执行）， Java 程序就装入该类文件并寻找一个名字为 “ main ” 的方法。如果找到， 
就试图用一个参数来调用该方法，该参数对应于从命令行键人的其余文字。 static 关键字指 
出 main 方法是与类关联，而不是与任何的类实例关联。因此，就没有必要为了调用 main 方法 
而生成适当类的任何实例。 

此外，我们还有一个必要的性质 “ public ”， 用于指明该方法（或）域可从类的外部访问。 
一个 public 方法（或类）对于整个系统都是可见的和可执行的，包括 JVM 启动序列，而 private 
方法只能从类内的对象/方法来执行。这在 “ main ” 本身的结构中当然是隐含的，因为它作为 
整个系统的第一个方法必须是可执行的。还有其他的访问标志的 变型： 可以像前面将类、域 
或方法定义为 “ final ” ，或者甚至定义成 “ abstract ”， 意思是类本身只是一个抽象，我们不能 
从中生成实例，而是应该使用该类的一个子类。再则，这些方法和性质的细节与高级 Java 程 
序员更为相关，而与理解 JVM 本身如何工作关系不大。 

10.4 对象 

10.4.1 作为类的实例创建对象 

类定义本身对于完成计算通常用处并不很大。更有用的是作为对象的这些类的实例，也 








J 64 _ 务二部分真实计算机 


就是类的具体实例，能够持有数据、调用方法，以及做有用的事情。例如，前面在记录一节 
定义的 “ fraction ” 类简单地定义一个分数有两 个域： 分子和分母。一个实际的分数就在这些 
域中有特定的一组值，可用于实际的计算。 

要创建一个类的实例，首先必须知道类的名字。请见如下的 jasmin 语句： 

new ExampleClassType 

该语句创建了 ExampleClassType 类的一个新的实例（在计算机内为其分配存储空间），并 
将一个地址压入到方法堆栈，该地址指向这个新的对象。仅仅分配空间还不够，还必须要用 
为该类型定义的某个构造方法将其初始化到一个有用和有意义的状态。要做到这一点，就有 
必要使用 1 nvokespeci al 并提供适合的方法和一组参数，如图 10-14 所示。 



图 10-14 创述一个 fraction 对象 

记住这个分数类（采用标准的样板）定义了一个构造方法该方法不接受参数。因 

此，我们构造新的分数就用下面的两行语句来完成分数的创建和初始化。 
new fraction 

invokespecial fraction/<init>()V 

实际上，这并不十分有用。其原因是，虽然我们刚刚创建和初姶化对象，但 
Invokespeclal 指令在返回时将弹出 fraction 的唯一引用。结果，我们新分配的存储块会丢 
失，现在就可能被作为垃圾回收。为了保持新 fraction 对象的访问，我们需要在调用 
invokespecial 之前复制地址，如图 10-15 所示。这个图还给出了如何将数据在对象域之间移 
动的例子。 

10.4.2 销毁对象 

对象销毁也由垃圾收集系统来处理，并可在指向对象的指针不再处于可访问的位置（如 
在局部变董中或在堆栈上）时进行。 
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示意 1 fraction 1 结构类型使用的第二个程序 


class public fractionfront2 
super java/lang/Obj ect 


; 样板 

method 


method public <init>()V 
aload —0 

invokespecial java/lang/Object/<init>()V 
return 
end method 


method public static main([Ljava/lang/String : )V 
.limit locals 2 
.limit stack 2 


; 生成一个新的 ' fractlorT 并存储到 W 郎变电 1 
new fraction 


invokespecial £raction/<init>()V 


； 将分 7 賦值为 2 
aload-1 
iconst.2 

putfield fraction/nunerator I 
； 消注意.不黹要对 fraction 重 新存储 

;将分母复制为 3 

aload_l 

iconat_3 

putfield fraction/denominator I 


生成一个新的 fraction • 
1 C 制，以便干 can < 1n1t > 
初始化 

存储新 fraction 


；装人 fraction 
；乐入分子的值 
；将于分子（作为 整数） 


装入 fraction (再一次> 
压入分母 

将 3 S ? 分母（作为整数） 


: 示分子 

getstatic java/lang/System/out LJava/io/PrintStream; 
aload.l ； 装人 fraction 

getfield fraction/numerator I ; 获得和压人分子 

invokevirtual java/io/PrintStream/print(I)V 


并 a 示 


； 显示一个斜线 

getstatic java/lang/System/out Ljava/io/PrintStream ； 
ldc "/" 

invokevirtual java/io/FrintStream/print(Ljava/lang/String : )V 


; 用 prlnt ( ln ) 扈示分母 

getstatic java/lang/System/out Ljava/io/PrintStream; 
aload.l ； 装人 fraction 

getfield fraction/denominator I ； 获得和压士分母 

invokevirtual java/io/PrintStreaa/printIn(I)V ； - 


并用 prlnt ( ln ) 显示 


return 
.end method 


生成和使用 fraction 对象 
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10.4.3 类型对象 

在任何 JVM 系统中，基本的类型都命名为 “Object” （即对象），或者更全面地说是 
java/lang/Object。 作为整个继承体系的根，系统中的一切都是某种形式的 Object。 因此， 
Object 的特性就是系统中所有一切所共享的基本性质， Object 的方法是可被所有对象调用 
的方法。这些方法因为是如此地基本，所以并不特别有意思。例如，所有的 Object 都支持 
一个 equal s () 方法，该方法在两个对象相同时返回真 （“ true”）， 在不同时返回假 
(“false”)。 

由于通用类型的 Object 可用作一般的数据保存器，程序员就可定义（或者更有可能使用） 
一个标准化的 List 类型，用以保存一组 Object。 然后，无须修改就可用这个类型来保存他的杂 
货店淸单、课表、他最喜爱球队的胜敗记录。作为 Java 语言的一部分，多数的标准数据结构 
都以这种方式定义，使得其中存储的数据（作为 Object) 对干如何使用这个结构没有施加任何 
限制。 


10.5 类文件和 . class 文件结构 

10.5.1 类文件 

在一个典型的 JVM 系统中，每个独立的类存储在一个类文件中，类文件就保持了该特定 
类的使用和执行所必要的信息。多数的信息是显而易见的，例如，类的名称、在继承层次中 
与其他类的关系，以及类所定义的方法和类的特点。存储的楕确细节可能是相当技术化的， 
甚至可能在不同的 JDK 版本之间有变化。所以，如果你对类文件格式的细节有专家级的需求 
(例如，如果你正在写一个编译器，该编译器输出 JVM 机器指令），你或许就应该去参考一本 
详细的技术手册，比如像 JVM 参考规范 e 。 对于非专家，下面的描述（以及附录 C 中更详细的 
描述）会给出类文件的一些特色。 

—般来说，一个类文件存储成一组嵌套的表，如图 10-16 所示。顶层的表包含了关于类 
的基本信息，如 JVM 编译的版本号、类名，以及基本的访问性质。这个表还包含一组子表， 
包括一个定义了方法、域、厲性以及类实现的直接接口子表。另一个子表包含了常量池 
(constant pool), 常量池存储了程序所使用的基本常嫒值和字符串。例如，如果类每次需要 
的值是 3. 1416而不是4字节的浮点值本身，这个值就被置于一个小的常嫒表中，要用到表的 
索引。 

这就有提高类文件空间效率的效果。虽然程序可用的不同浮点常数超过40亿的，但实 
际上几乎很少有程序使用的浮点常量数会超过100左右。 一 个只有200个条目的常量池可用 
1个字节进行索引，因而每个常量访问就节省3个字节。即使一个使用60000个常量的巨大 
程序，用2字节索引也能访问任何一个常数。除了存储浮点常量，常 S 池还保存整数、长 
整数、双精度数，甚至类似字符串 （String) 常被的对象（像提示句 “Please enter your 
password (请输入密码 ）”， 可能就存储起来，以便通过调用 println 打印）。事实上，我们 
已经熟悉的 ldc 操作实际上就代表“从常量池中装入”的意思，并（如我们可看到的）可 
用于几乎任何类型。 


㊀ Tim Lindholm 和 Frank Yellin. The Java Virtual Machine Specification • 第 2 版 （ Addison-Wesley, Boston, 1999 )。 
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庵 幻数字 （4 个 字节） 

OxCAFEBABE 


次版本号 （2 个 字节） 

主版本号 （2 个 字节） 

常 ft 池数 （2 个字节> 

访问标忐 （2 个字节） 

第一 个常量 池人口 
第二个常 ft 池人口 


该类 （2 个 字节） 

指向常 ft 池入口 


超类 （2 个字节） 

指向常董池入口 


接口数 （2 个字节） 

第0个接口 （2 个 字节） 

指向常 ft 池入 U 


第1个接 U (2 个字节） 

指向常 S 池入口 

域数 U 个字节） 



方法数 <2个字节） 

第0个域（变鼇 大小） 

第1个域 （变釐 大小） 


M 性数 （2 个字节） 

第0个方法（变量大小） 

第1个方法（变董大小> 



第0个属性 （变徵大小） 

第 个厲性（变# 大小） 



flUO -16 类文件格式槪览 


10.5.2 启动类 

在一个类被实际运行程序使用之前，该类必须被从磁盘中加栽，链接成可执行的格式， 
并嵌终初始化到一个已知的状态。这个过程是 JVM 程序必须提供的基本服务之一，这种服务 
是通过原始类加载器 （primordial class loader ) 的形式来提供的，这是标准定义类型 
java.lang.ClassLoader 的一个实例化。 JVM 设计者在决定原始类加载器在某最小层次上能 
提供什么服务方面有某些回旋的余地。 

例如，要加载一个类，加载器通常必须能在局部存储器中找到这个类（通常通过在类名 
字的后面加上 . class 后 缀）， 读入存储的数据，并生成一个 java.lang.Class 的实例来描述这个 
类。在某些情况下（如 Web 浏览器或复杂的 JVM 实现），可能需要将单个类从归档文件 中去除 
掉，或者从网络上下栽适当的 applet 。 原始加载器还必须对类结构足够了解，以便在需要时去 
除掉超类。如果你写的类扩展了 Applet , 则 JVM 要使程序正确运行就需要理解 Applet 及其特性。 
将这些不同的类链接 ( link ) 成一个适当的运行时的表示則是链接器的任务（通常也结合到类 
加载器中）。 

JVM 类加载器的另一个重要任务是验证 ( verify ) 字节码执行是安全的。当堆栈上没有整 
数时，试图执行一个整数乘法就是不安全的。试图对不存在的类创建一个新对象也是不安全 
的。验证器负责实施本书讨论的大多数安全规则。最后，类通过调用适当的例程来初始化 
( initialization ), 将静态域设置为适当值，或者使类成为适合执行的状态。 



真实计算机 


10.6 类层次汇编指令 

这个部分主要是属于 Java 类层次的髙级特性，故可以跳过而不会影响连续性。 

实际上， JVM 提供的严格类型层次会有一些问题。由于每个子类只能有一个超类，每个 
对象（或者类）就最多只继承一组性质。真实情况很少如此简洁明确。例如，一个相当明显 
的层次性就是标准的生物学上的分类。狗是哺乳动物，因而也就是脊椎动物，因而也就是动 
物，等等。这在 JVM 类层次中可容易地建立模型，就是使狗成为哺乳动物的子类，依此类推。 
然而，在实际中狗还继承了宠物类的很多特性，不仅猫、仓鼠、还有古比（一种鱼）、长尾小 
鹦鹉、鬣蜥（但不包括熊、猎豹以及其他非宠物哺乳 动物） 等也与狗一样都属于这一类。所 
以我们可以看到，无论宠物类还包括什么，它都跨越了标准生物学的界限。由于从多个类中 
继承，也就没有办法在这类结构中创建一个同时是哺乳动物和宠物的类（或对象）。 

Java 和 JVM 通过接口 ( interface ) 机制提供一个过程，以保持这种规则性。接口就是一个 
像类一样（亊实上，它存储在相同格式的文件中，只有一些访问标志变化）的特殊的对象， 
它定义了一组性质 （域） 和函数（方法 h 对象永远都不会是一个接口的实例，对象实现接口 
是通过明确地在其类内部对这些性质和函数进行编码来完成的。例如，可能除了定义宠物的 
性质，还需要有获得名字和拥有者的函数（假设这些是有字符串返回值的方法），也就是确定 
名字和拥有者的适当方法。接口永远不会实际地去定义方法的代码，而是定义了程序员所要 
求实现的方法。类似地，虽然接口能定义域，但作为接口的一部分所定义的域必须是静态的 
( static ) 和锒终的 （ final ), 这反映出一个对象永远都不会是一个接口的实例，这样也就没有 
因实现域所能得到的存储空间。 

到此，一个熟练的程序员就能定义狗 （ Dog ) 类，使得其继承哺乳动物 （ Mammal ) 类， 

因而也就得到了哺乳动物的所有性质。他还可以将类定义成“实现” 了宠物 （ Pet ) 接口，这 

要确保他为 Dog 类所写的方法中有每个 Pet 类都需要的某些方法。 

程序员就可以在其类文件中不仅将 Mammal 类定义成 Dog 类的超类，还为实现 Pet 接口做了 

定义。这就要涉及如下的一个新的汇编 指令： 

.class public Dog 
.super Mammal 
.Implements Pet 

Pet 接口的声明和使用与写一个常规的类文件非常类似，但有两个主要的差异。首先，程 
序员不是使用 . class 汇编指令来定义类名，而是以相同的方式使用 . Interface 汇编 指令： 

.interface public Pet 

其次，在 Pet . j 文件中的方法会有方法声明但却没有与其关联的实际代码（暗指方法是抽 

象 的）： • 

.method public abstract getName()Ljava/1ang/Strlng; 

.end method 

.method public abstract getOwner()Ljava/lang/String; 

.end method 

接口类型和类类型的用法之间还有一些微小的差异。首先，接口类型不能直接作为对象 

创建，虽然可以创建实现了接口类型的对象。在上面的例子中，虽然生成一个 Dog 是合法的， 

但生成一个 Pet 却不是合 法的： 

new Dog ；可以这样做 

new Pet ;这会产生…个错误 

然而，接口可作为参数类型接受并返回方法的值。下面的代码将接受任何实现了 Pet 接口 
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的有效 对象： 

invokespecial Dog/isFriendlyTo(LPet:)I 

该代码还指出，一个特定的 Dog 是否与一个特定的 lg Uana (鬣蜥）是友好的。最后，如果 
你有一个实现了特定接口的对象，但是不知道类是什么（就像上面 isFrendlyTo 的例子 ）， JVM 
就提供一个基本的指令 invokelnterface ， 使得接口方法能直接调用而无需考虑底层类是什 
么。 Invokeinterface 的语法类似于其他的 invoke? 指令但略复杂一些，通常也比其他方法调 
用指令更慢和更低效。除非你对接口有特定的需求，最好还是由专家来处理接口问题。 

10.7 注释 示例： 再讨论 Hello , World 

到此，我们就可以对第一个 jasmin 例子（包括样板）给出一个详细的解 释了： 

•class public jasminExample 

是一个类汇编指令，指定了当前类的名字。 

.super java/1ang/Object 

指出其在标准层次体系中 的位置 （明确地，是一个 java / lang / Object 子 类）。 

.method public <init>()V 

这是构造一个 jasminExample 类型元素的方法。它不接受参数，无返回值，名为 < init> a 
aload_0 

1 nvokespecial java/1ang/Object/<init>()V 

这初始化了一个 jasminExample , 我们装入例子本身并确保其首先成功地作为一个对象初 
始化。 

return 

无褥其他初始化步骤，所以退出该方法。 

.end method 

这条汇编指令结束了方法的定义. 

.method public static main([Ljava/1ang/String;)V 

这是主方法，由 Java 程序本身调用，它接受一个参数，即一个字符数组，不返回任何值。 
这个方法定义成公共的和静态的，所以可从类的外部调用而无需存在该类的任何对象。 

.limit stack 2 

我们需要两个堆栈元素（一个用于 System . out , —个用于 String )。 
getstatic java/1ang/System/out Ljava/io/PrintStream; 

从系统类中获得名为 “ out ” 的（静态）域。它的类型应该是 PrintStream , 在 java . io 包中 
定义。 

ldc "This is a sample program." 

将要打印的字符串压入（更准确地说，将常量池中字符串的索引压入）。 
invokevirtual java/io/PrintStream/println(Ljava/1ang/String;)V 

在 System . out 调用 “ println ” 方法。 
return 

退出这个方法。 

.end method 

这条汇编指令结束了方法的定义。 
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10.8 输入和 输出： 一个解释 

10.8.1 问题描述 

除了语言本身的语法， Java 编程语言还定义了更多的方面。语言被接受并得到广泛使用 
的关键是存在各种软件包，用以处理编程中不同方面的困难问题，如输入和输出。例如， 
java.io 就是特别为处理系统输入和输出而设计的一组软件包，该包的处理是在足够抽象的层 
次上，因而可以在不同的平台上移植。 

使用输入和输出外设常常是任何计算机程序的最困难部分之一，尤其是在汇编语言编程 
中。其原因简单地说就是存在各种令人困惑的设备及其多样的工作方式。 

至少在理论上，像磁盘驱动器这样全部输人在任何时候都可得到的设备，与像网络卡这 
样数据只在特定时间和受限条件下得到的设备有很大的不同。不仅有不同种类的设备，即使 
是在一个大的种类内部，也有一些微妙但重要的差异，如键盘上按键的布局、是否有第二个 
鼠标键，等等。然而，从程序员的角度看，这些差异不仅不重要，而且会导致混乱。举个例 
子，一个电子邮件程序的主要工作是从用户那里读入，得出该邮件要发往哪里，并发送邮件。 
数据如何到达的细节（比如，是通过一个以太网连接达到吗？是通过键盘按键的一次敲击 
吗？是通过一个剪切和粘貼操作来得到大块数据吗？是作为硬盘上的一个文件得到吗？）对 
于电子邮件程序是（也应该是）无关紧要的。 

遗憾的是，在基本的机器指令级，这些差异可能是至关重要的。从以太网卡读数据与从 
磁盘或从键盘读数据不是一回事。（像 JVM 所支持的）基于类的系统的优势是类本身可被操纵 
和统一，使得程序员的任务变得不那么混乱。 

10.8.2 两个系统比较 
一般外设问題 

为了说明这种混乱，考虑读入数据并将其打印到某处（到屏幕或磁盘）这样一个任务。 
为简化，假设输入设备（数据的进入点）是一个 K« 的键盘或磁盘。不用细解释，键盘就是 
一个复杂的开关。当一个键被按下时，就产生某个电连接，使得计笕机能确定当时哪个键被 
按下了（因此也就能确定按的是哪个字符）。磁盘是一个信息存储设备。从逻辑上看，你可以 
将它想象为巨大的一组“扇区 (sector)", 每个扁区存有固定数 M 的字节（通常是512个字节， 
但也不总是这样）。事实上，还更复杂一点，因为信息被排序成多个一组多盘片 （platter) (每 
个盘片看起来就像一个由磁带制成的 CD), 每个盘片有若干个编号的同心磁道 (track ), 每个 
磁道被划分成若干个像比萨切片一样的扇区 (sector) (见图10-17)。要读或写一个扇区的数 
据，计算机需要知道盘片号、磁道号以及磁道内的扇区号。但大多数时间硬盘驱动控制器会 
处理这些问题。 

注意这两种设备之间有一些重要的关键区别。首先，当从键盘读时，由于只能知道在某时 
刻正在按下的键，你就最多只能得到一个字符的信息。与此相反，从磁盘读却能同时给你一个 
扇区的信息。在磁盘上还可以向前读以发现下一个扇区装的是什么，而这对于键盘是不可能的。 

虽然我们要打印到屏幕的精确细节不同，但都存在类似的差异。如果在计算机上正在运 
行一个窗口管理器，我们当然就要打印到独立的窗口中而不是像文本模式那样打印到屏幕上。 
例如，在文本模式中，我们总是知道打印要从实陈屏幕的左边开始，但我们完 全不知道某个 
时刻窗口在哪里。我们试图打印时，窗口甚至在移动。因此，根据前面所定义的结构，打印 
到屏幕与向磁盘写数据全然不是一回事。 
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读/写头 



我们将会看到， JVM 通过使用一个适当的类结构而避免了很多混乱。它使用的类结构不 
同于另外一种常用的系统，就是可使用 Windows 98的英特尔奔腾系统。 

英特尔奔腾系统 

附到奔腾系统的每个设备都带有一套设备驱动器 （device driver )。 事实上这对于每个计 
算机都是如此。驱动器定义了如何与硬件交互作用。在这一点上驱动器与类和方法类似，除 
了没有有用的统一接口。任何 Windows 系统都有的敁简单的一组设备驱动器就是 BIOS (基本 
输入输出系统），作为操作系统的组成部分发饱。（实际上， BIOS 比奔腾提前近20年就发惶， 
但来自于 IBM - PC 的顽固影响仍在起作用）。 

在英特尔奔腾机上，用一条机器指令 （1 NT ) 将控制传递给 BIOS 。 当这条指令执行时， 
计算机检査存储在特定位 S ( AX 寄存器）的值，以确定应该做什么。如果存储的值是 0 x 7305, 
计算机将访问附加的磁盘。为了正确地做这件事情，它还检査一些存储在其他寄存器中的值。 
这些值 包括： 感兴趣的磁盘扇区号、放 K 新数据的存储位置、从磁盘读还是向磁盘写。在任 
何一种情况下，都至少要传递一个扇区的数据。 

如果存储在 AX 寄存器中较低半部分的值是 0 x 01 ,则这条将控制传递到 BIOS 的指令还导 
致计算机读一个字符。实际上，这个过程更复杂一些。如果存储的值是0 x 0〗，计算机将等待 
直到一个按键被按下并返回那个字符（还将字符打印 到屏幕 上）。如果存储的值是0 x 06,则计 
算机就检测这时是不是有按键被按下，并返回它（不用打印）。如果没有按键被按下，则不返 
回任何东西（并将一个特殊标志罝位以指明这一 点）。 这两个功能都是一次只读一个字符。要 
一次读几个字符，且这些字符在超前敲入缓冲器中可得到的话，就使用存储值 0 x 0 A , 该功能 
不返回字符，而是将它们存储到主存储器。 

输出有类似的细节问题。要向磁盘写，你就要使用与读入时间样的操作，而在文本模式 
或窗口系统下写到屏幕需要两种不同的操作（与读操作/值不同）。 

所有这些都发生在设备驱动器和硬件控制器已经“简化” 了访问外设的任务以后。根本 
的问题是各种硬件相互之间差异太大。程序员可以写出一个有特殊用途的函数，比如，针对 
输入完成这样的 工作： 如果输入要从键盘读入，就使用操作 0 x 01, 如果要从磁盘读入，就使 
用操作 0 x 7305: 在任何一种情况下，都将值以统一的格式移动到统一的位置。这样的程序写 
起来或易或难，但需要对细节的关注、硬件知识，以及不是每个程序员都愿意花费的时间。 
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这种混乱就是为什么 Windows 操作系统存在的部分原因。 Windows 的部分功能就是为程序 
员提供了粗线条的接口。微软的程序员已经花时间编写了这些考虑了各种情况的详细函数。 

JVM 

与此形成对照的是，在一个适当设计和构造的基于类的系统中，这种统一是通过类结构 
本身来达到的。在 Java (以及在 JVM 的扩展）中，大多数的输入和输出都是由类系统来处理 
的。这就使得类能够处理信息隐藏并只通过方法给出重要的共享性质。 

简要回顾 一下： java . io .* 包是为 Java 1.4 定义的，它提供了多种类，每个类都有不同的性 
质用干读和写。用于输入的最有用的、也是最常用的类就是 BufferedReader 。 这是一个相当 
强大的髙级别的类，能读入很多种一般化的“流”对象（见图 10 - 18 )。 Java 的 1.5 版本还包括 
了一些附加的类，如 Sanner , 也以类似的方式处理。 
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图 10-18 使用 BufferedReader 从进盘读人一个文件 

遗憾的是，键盘缺乏这些 BufferedReader 对象的很多典型特性，但类系统提供了一种方式 
从其他种对象来构造一个 BufferedReader 对象。标准的 Java 库确实提供了一个对象，这是 
System 类的域，称为 Syatem. In ， 通常关联到键盘。然而，这个域被定义成保存最低级、最原 
始的类型的输入对象之一，即一个 java . io . InputStream 。 （ InputStream 与 BufferedReader 之间的 
关键差异包括缺乏缓冲和除了字节数组不能读其他任何类型）。 

java . io .* 包还提供了一个特殊的类型用于从磁盘读，无论是作为一个 FilehiputStream 还是 
作为一个 FileReader , 两者都可用于构造一个 BufferedReader 。 一旦完成这件事，访问文件就 
等同于访问键盘，因为两者都使用与 BufferedReader 类相同的方法。 

在下一节中，我们将（采用更广泛可用的 Java 1.4 语义）构造一个程序，实现的功 能是： 
从键盘读入一行，并将该行拷贝到标准输出。虽然该过程仍复杂，但复杂性在子 
BufferedReader 的构造上而不是在实际的数据读过程。对于对象构造的简单的一次性代价，任 
何数据都可通过 BufferedReader 来读，而在英特尔上相对应的程序则对每个输入/输出操作都 




需要考虑特殊情况和魔幻数字。 


10.8.3 示例： 在 JVM 中从键盘读入 

在 Java 中执行这个任务的代码例子在图 10 - 19 中给出。注意需要两个 转换： 首先是从 
InputStream 构造一个 InputStreamReaden 其次是从 InputStreamReader 构造一个 
BufferedReader 0 事实上，在 Java 代码中甚至还隐藏了 一点复杂性，因为实际的 
BufferedReader 构造函数是这样定 义的： 
public BufferedReader(Reader in ) 

惫思是可从任何种类的 Reader 来构造 BufferedReader ， InputStreamReader 只是其一个子类。 

如前所述，对象的构造是通过两个步骤完成的。首先，必须创建这个新的对象本身（通 
过 new 指令），然后必须调用适当的初始化方法（通过 Invokespeclal )。这个程序需要创建两 
个新的对象，一个是 InputStreamReader ， 一个是 BufferedReader 。 一旦创建了这两个对象， 
BufferedReader 类定义的一个标准方法（称为 “ rea dli ne ”） 就从键盘读一行并将其作为 String 
返回 （ Ljava / lang / String ;)。 采用这种方法，我们就能得到一个串并通过 System . out 的 primln 方 
法照常打印。 



10.8.4 解答 

•claas public jvmReader 
■super java/lang/Object 

； 对象创 建所宪 的样板 
.method public <init>()V 
aload_0 

invokespecial java/lang/Object/<init>()V 



•end method 


.method public static main([Ljava/lang/String;)V 
.limit stack 4 

; 创建一个新的 InputStreamReader 类型的对象 
new j ava/io/InputStreamReader 

； 从 System.In ( InputStreamReader ) 初始化构造函数 
dup 
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getstatic java/lang/System/in Ljava/io/InputStream; 

invokespecial java/io/InputStr ei uiiReader/<init> (Ljava/io/InputStream;)V 

； 等价于 new InputStreamReader( InputStream) 

; 现在创达一个新的 BufferedReader 
new j ava/io/BufferedReader 

; 复制， 并将其 S 于 InputStreamReader 之下 
dup.xl 

; 再次 复制， 并将其 S FInputStreamReader 之下 
dup_xl 

；堆栈现在保存若 BR. BR. ISR、BR 

; 消除不需要的 BufferedReader 
POP 

； 使用 InputStreamReader 调用 BufferedReader 的构造函数 
invokespecial java/io/BufferedReader/<init>(Ljava/io/Reader;)V 

； 初始化的 BufferedStreamReader 埂在就在堆栈顶部 
; 调用 readline 方法得到一个申（并在堆栈顶部 离开） 

invokovirtual java/io/BulferedReader/readLine()Ljava/lang/String; 

； 得到 System.out 

getstatic java/lang/Systen/out Ljava/io/PrintStroam; 

swap 

invokevirtual java/io/PrintStream/printlnCLjava/lang/String;)V 

return 

.end method 

10.9 示例： 通过递归求阶乘 
10.9.1 问题描述 

作为锒后一个例子，我们给出在 JVM 上使用类系统完成递归（即函数或方法调用其自身） 
的代码。递归函数是在组合学和槪率论中广泛使用的数学操作。例如，如果某人想知道洗一 
副52张的牌有多少种不同的方式，答案就是52!,也就是 52 x 51 x … xl 。 阶乘的一个很好的 
性质就是有一个简易的递归定义 ，即： 

N\=N • ( N -\)\ 对于 yv > i , 且0! =1 
采用这个公式，我们就可构造一个递归的方法，就受整数 w 并返回 ah 。 

10.9.2 设计 

解决这个问题的方法很简单，可作为一年级编程教科书的一个例子： 

To calculate N! 

if (N <- 0) then 
return 1 
else begin 

recursively calculate (N-l)! 
multiply by N to get N * (N-l)! 
return N * (N-l)! 


end 
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( 严格的数学家会指出，这个伪代码还将负数的阶乘定义为 d 。 

此外，还需要一个（公共的、諍态的）主例程来设置 n 的初值并打印最终结果。由于该主 
方法是静态的，所以如果阶乘方法不是静态的，就需要创建适当类的一个对象实例。如果我 
们将阶乘方法定义成静态的，就可直接调用它。 

10.9.3 解答 

这里给出了计算 5! 的解。可用类似的代码求解几乎任何递归定义的问题。 

•class public factorialCalculator 
- super java/lang/Object 

； 对象创建所需要的样板 
.method public <init>()V 
aload^O 


iavokeapecial java/lang/Object/<init>()V 
return 
.end method 


•method public static main([Ljava/lang/String;)V 

: 我们霜要两个堆栈元素，一个用于 Syste»«.out, — 个用于 String 
.limit stack 2 


bipush 5 ; 压人 3, 以计算 5! 

invokestatic factorialCalculator/fact(I)I 
； 5! 现在躭在堆栈 J ： 计算出来 

; 得到 和压人 System.out 

getstatic java/lang/System/out Ljava/io/PrintStroam; 

; 以准确的次序褕出 Systen.out 和 5! 

swap 

； 调用 PrintStreaw/prlntln 方法 
invokevirtual java/io/PrintStreajn/println(I)V 


return 
•end method 

.method static fact(I)I 
.limit stack 2 

iload.O ; 检验是否参数 <0 

iflG ； 如果这样，立即返回 1 


iload_0 ；压人 N 

iinc 0 -1 ； 计算 (N-l) 

iload.O ; 装人 （N - 1> 

; 计算 (N-l) ! 

invokestatic factorialCalculator/fact(1)1 


; 料卩 (N-l ) 都在堆栈上 


imul 


Exit: 


; 相乘，得到最终答案 
; 并将答案返回 


iconst_l 
iretum 
•end method 


； 0! 定义为 I 
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10.10 本章回顾 

• JVM 由于其与面向对象编程语言 Java 的紧密关联，为面向对象编程和用户定义类的类型 
提供了直接的支持。对数组和对象的引用均由基本类地址所支持。 

• 一个数组是由一个整数或多个整数所索引的一组相同类型数据的集合。有独立的机器级 
指令来创建、读、写一维和多维数组，还可以获得数组的长度。 

•当数组（或任何数据）不再有用或可访问时， JVM 将自动通过垃圾收集来回收所使用的 
内存，并使其可重用。 

• JVM 还支持记录（带名字的域的 集合〉 和类（定义了访问方法的记录），并支持接口 
(抽象方法的集合>。类文件是 JVM 程序存储的基本单位，它结合了所有这三种类型。 

•域通过 getfleld 和 putfleld 指令来访问。静态（类）域用 getstatlc 和 putstatlc 来访问。 

• 类通过 4 种 invoke ? 指令之一进行访问，具体使用哪种取决于类和所涉及的方法。 

•对象是作为类的实例由 new 指令创建的。每个类必须包括一个适当的构造函数（典型地 
命名为 < init >), 用来将新实例初始化为有效值。 

•在 JVM 上通过 I / O 原语访问外部世界是通过一组标准化的类和方法完成的。例如， 
System . in 是一个 InpmStream 类型的静态域，其特性和访问方法由标准文档定义。从键盘 
读可以用 System . ii ! 作为一个基类，通过调用特定的方法和创建特定的类来完成。 

• 使用类系统也可支持递归，这可通过在每次新的方法调用时生成一组新的局部变设来实 
现。这不同于以前的 jsr / ret 技术，也不同于像奔腾或 PowerPC 所采用的在堆栈帧上创 
逮新的局部变 ffl 的技术。 

10.11 习题 

1. JVM 的用户定义类型与其他机器如8088或 PowerPC 在实现方面有哪些不同？ 

2. 在 PowerPC 上如何为一个局部数组创建空间？该空间如何回收？在 JVM 上做法有何不同？ 

3. 在典型的计算机如奔腾上，数组元素通常是通过索引模 式来访 问的。在 JVM 上采用的是什 

么方法？ 

4. 像 String . toUpperCaseO 这样的标准方法是如何结合到 JVM 中的？ 

5. 域与局部变量有何不同？ 

6. Invokevlrtual 与 Invokestatic 有何不同？ 

7. 为什么静态方法比非静态方法少需要一个参数？ 

8. 与下列方法对应的类型字符串是什么？ 

a . float toFloat ( int ) 

b . void printString ( Slring ) 

c . float average ( int ， int ， int ， int ) 

d . float average(int []) 

e . double [][] convcrt(long [][]) 

f . boolean isTrue ( boolean ) 

9. 关于 < init > 方法有什么特殊的地方？ 

10. 每个类文件（见附录 D ) 中第4个字节是什么？ 

11. 一个方法能使用的不同字符串值大约有多少？ 
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10 .12 编程习题 

1 . 写一个 j asm i n 程序，采用 Java 1.5 的 Scanner 类从键盘读入一行并同时显示在屏幕上。 

2 . 写一个 jasmin 程序，采用 JavaAWT (或一个类似的图 形包） 在屏幕上显示牙买加国旗。 

3. 写一个 jasmin 程序，确定当前的日期和时间。 

4. 写一个 Time 类以支持时间的算术操作。例如，1:35+2:15为3:50,而1:45+2:25为 4 :10。 

5. 写一个 Complex 类，支持复数（如 3 + 4 i ) 的加法、减法和乘法。 

6 . 斐波那契序列可如下递归 定义： 序列的第一个元素和第二个元素的值都是1。第三个元素是 
第一个元素和第二个元素的和，即2。一般来说，第 N 个斐波那契数是第 N - 1个和第 N -2个 
斐波那契数之和。写一个程序，从键盘读入一个数 N ， 并递归地确定第 N 个斐波那契数。为 
什么这是解决这个问题的一个低效的方法。 

7. (用教师同意的任何一种语言）写一个程序，从磁盘读入一个类文件，并打印出常数池中 
的元紊数量。 

8 . (用教师同意的任何一种语言）写一个程序，从磁盘读入一个类文件，并打印在其中所定 
义的方法的名字。 
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A .1 门 

没有晶体管，就没有现代计算机。正如摩尔定律（晶体管密度每18个月增加 一倍） 所指 
出的，制造和安置晶体管的能力是在计算机芯片内控制 • 移动及处理数据的基本方式。 

晶体管可被看作是一种电控的开关。一个典型的晶体管及其电子图如图 A -1 所示。在正常 
情况下，电流从发射级流到集电极，就像水流过管子或汽车驶过隧道一样。但是，只有在基 
极施加适当的电信号时，才允许电流流过。没有这个控制信号，就如同关闭了龙头或亮起了 
红灯。发生这种情况时，电流就不能通过。通过将这些开关结合在一起，工程师们就能建立 
依赖结构，例如，只有所有晶体管都加电时，电流才能通过。 



NPN 晶体管 



图 A-1 晶体苷和符 5 的样例 

图 A -2 显示出两个依赖结构的例子。在串联 ( serial ) 电路中，两个晶体管共享一个共同 
的路径，如果电流要从 A 点流到 BA ， 就必须能同时流经两个晶体管。在并联 （ parallel ) 电路 
中，每个晶体管有其自身的电流路径，任何晶体管都能允许电流流过电路。 


- 

_ _ B 

图 A-2 串联（上图）和并联（下图）的晶体管 





在图 A -3 中显示的电路是两个晶体管以串联方式互连的例子。为了让电流从电源0心）流 
到输出，对两个晶体管都要施加正确的信号以保证电流通过。只要两个晶体管中任何一个是 
打开的开关，电流就不能流过。这就意味着只有晶体管 I 是闭合的并且 （ AND ) 晶体管2也是 
闭合的情况下，电流才能流动（输出端有电力）。类似地，在图 A -4 中，两个晶体管是并联的， 
如果第一个晶体管是闭合的或者 ( OR ) 第二个晶体管是闭合的（或者两个晶体管都是闭合的）， 
才能允许电流通过。 



与电路 


图 A-3 简化的与门和符号 



或电路 


图 A-4 简化的或门和符号 

计算机的基本构件块由称为门 （ gate ) 的简单电路组成，这些门实现了这些简单的逻辑信 
号。每个门一般包含 i 到6个晶体管，实现了基本的逻辑和算术运算。记住，在逻辑中所用的 
基本值是真和假。如果“电流在流动”代表真，则图 A -3 中电路就用一个简单（并且有点理想 
化，不要用 Radio Shack (美国一家著名的消费电子销售商）的零件建造这个系统）的门实现 
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了逻辑与 ( AND ) 的功能。其他能实现的功能还包 括：或 （ OR ， 见图 A -4)、 非 （ NOT )、 与 
非 ( NAND ) 以及或非 ( N 0 R ) o 用于绘制各种门的符号在图 4 -5中给出。注意，每个门（除 
了非门）都有两个输入和一个输出。还要注意，非门符号在输出线上有一个圈（表示信号反 
相）。与非门（即与门的非）•的符号和与门的符号相同，但在输出处有一个小圈表示反相。类 
似地，或非门（即或门的非）就是一个带有反相圈的或门。 

=o - 

与门 ( AND ) 



o 

与非门 ( NAND ) 



或非门 ( NOR ) 



非门 ( NOT ) 


异或门 ( XOR ) 


fflA -5 门的类型和符唼 


A .2 组合电路 

复杂的门网络可以实现任何期望的逻辑反应。例如，异或 （ XOR , 即 exclusive OR ) 的 
功能是当且仅当只有一个输入为真（而不是两个输入都为真）时，输出才为真。用逻辑表达 
方式 写为： 

A XOR B = (A ORB ) AND (NOT (A ANDB )) 

若写成真值表，可如表 A - l 所示。 


表 A -1 定义了异或功能的真值表 


A B 结果 

真 

真 

假 

真 

假 

真 

假 

真 

真 

假 

假 

假 


最后，要绘制成电路图，则如图 A -6 所示。 

组合电路的基本槪念就是输出总是当前输入信号的函数，而无须考虑信号的历史变化。 
这样的电路对于实现简单的判定或算术操作非常有用。对于如何设计这种电路的全面性描述 
超出了本附录的范围，图 A - 7 显示出如何用一组门来实现简单的二进制加法（计算机的算术逻 
辑单元 （ ALU ) 的组成部分）。 
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图 A -6 用门实现异或功能 




图 4-7 单个位的半加法器 

明确地说，这个电路要接受两个位信号 （ A 和 B >， 并输出这两个信号的和以及是否有进 
位。（这个电路有时被称为“半加法器”）。对二进制加法表进行检査可以发现，两个位的和就 
是对它们做异或运箅，而当且仅当两个位都是1时才产生进位，换句话说，就是两个位的与。 
类似的分析能得出一个更复杂的设计，这个设计能加入前一级加法的进位（就是“全加法器”， 
见图 A -8)， 或者一次将若干个位相加（就像在寄存器中）。图 A -9 显示出如何用4个全加法器电 
路的复制来执行一个4位的加法。当然，32位的复制就能将奔腾的两个寄存器相加。我们也可 
以建立一个电路来执行二'进制乘及其他操作。将这些简单的门增殖几十亿倍，就达到了奔腾 
的能力和复杂度。 



图 A -8 单个位的全加法器（带进位) 
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图 A -9 级联的4位加法器，包括内部进位 


A .3 时序电路 


与组合电路形成对照的是，时序电路保留一些存储单元和电路的历史信息。时序电路的 
输出不仅取决于当前输入，也取决于过去的输入。对此的另一种表达方式就是这种电路有一 
个内部状态。通过利用这个内部状态，我们就可以存储信息以备后用，实质上就是为寄存器 
创逮必要的存储空间。 

一种最简单的时序电路就是 S - Rf 发器 ( S-R flip - flop ), 如图 A -10 所^为理解这个电路， 
首先假设 S 和 R 都是0 (假）， G 是0，0为1 (真）。由于 G 为真 ， RNOR 0就是1。类似地 ， S 
NOR 0就是1。这样，我们看到这个配置在内部是一致的，只要每个部件都在工作（通常就是 
指带电），电路就保持稳定。类似的分析还可看出，如果 S 和 R 都是0,而 G 是1时，结果就是一 
个自身一致的稳定状态。 

这个简单的触发器可用作为1位存储器，0的值就是存储在寄存器中的值。信号 S 和 R 可分 
別用于对触发器置位和^5：(置为1或0)。我们可以观察到，如果 S 变为1,将迫使上面的 NOR 
门的输出成为0。在 R 和 C 都为0的情况下，下面 NOR 门的输出就为1，所以现在存储的值就是 
1 。类似地分析，如果 RS 为1，就迫使2成为1，2成为0。 
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遗憾的是，如果 S 和 R 都是1,就会发生不好的亊情。根据符号表示， G 和 G 应该总是取相 
反的值。但如果两个输入都是1,则两个输出就都是0 (你可以自行确认一下）。从纯粹的数学 
意义上说，我们可以将这看作是在逻辑上与用零除等价的情况，即是一种要避免而不是要分 
析的东西。类似地，即使在输入线上的一个短暂电尖峰也会导致触发器不可预测地改变状态， 
这是要尽可能避免的事情。 

由于要避免这种事情，其他种类的时序电路就更常用于计算机。最常见的电路将控制信 
号与时序信号（通常称为时钟信号）结合起来，用以同步控制信号并防止短期波动对电路的 
存储元件产生影响。请注意看图 A -11, 时钟信号的作用是使触发器能改变状态。如果时钟信 
号为低，则 S 或 R 的变化不能影响电路存储元件的状态。 



图 A-1 丨一个时钟同步的 S-R 触发器 

我们可以将这个时钟同步的触发器进一步扩展，使其更有用和更安全。图 A -12 的电路图 
显示的 是一个 D 触发器。 f 你所见，这个电路在时钟以外只有一个输入。 D 输入捆绑到触发器 
的 S 输入，而的互补端 D 则被捆绑到 R 输入。这就避免了 S 和 R 同时为1。当一个时钟脉冲发 
生时，的值就被存储到触发器（如果的值是1,则 (2 变成 h 如果的值为0,则2 变成0)。 
时钟脉冲发生之前，在 D 端的变化不会影响触发器的值。这就使 D 触发器在复制和存储数据方 
面非常有用。比如，可从 I / O 设备中读入数据到寄存器以备后用。 



图 A-12 — 个 D 触发器 


184 附录 A 数字逻辑 


SR 触发器的另一个变型就是 T 触发器（图 A -13)。 像 D 触发器一样，这是将时钟同步的 S-R 
触发器扩展成单输入，但附加了反馈线，用于控制输入/时钟脉冲如何通过。在这个电路中， 
每次输入被触发，触发器就改变状态（翻转）。例如，如果 G 是1 (那么 G 就是0)，则下一个 
脉冲就会触发下面的输入线（本质上就是前面电路的 R 输入），并复位触发器使得 Q 为0。 



A .4 计算机操作 

采用这些构件块就可以建立与计算机体系结构相关的髙级结构。特別是，一组1位的触发 
器（如 S - R 触发器）就能实现一个简单的寄存器并存储所需数据。例如，要做加法，需要两个 
1 位寄存器，每个寄存器的0输出都连接到简单加法电路的一个输入。结果输出位就是这两个 
寄存器位的和，可捕获并（通过一个 D 触发器）存储在另一个寄存器中。 T 触发器可与加法器 
电路结合使用，以建立一个简单的脉冲计数器。当然，这些描述过于简略，但能够让你对计 
算机设计者所面临的任务有所认识。 
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本文中的示例助记符（操作码用十六进制表示）——说明 

概要： 本操作码并不存在，只是用来说明每个条目的格式。右侧描述的是相应操作所需 
的必要初始堆栈状态和创建的最终堆栈状态。注意： long 和 double 需要占用两个堆栈单.元， 
如下所示。 

初始 状态 ： long 
long 

最终状态 ： float 

aaload(0x32) —— 从地址数组中加载值 

概要：从堆栈中弹出一个数组地址（对象引用）和 integer , 取出一维地址数组中指定位 
S 的值。取出的值被压入栈顶。 

初始 状态 ： int (索引） 

address (数组引用） 

最终状态 ： address (对象） 

顶端所弹出的参数为定义所用 
位》•的索引。第二个弹出的参数为需存储的地址值，第三个（最后一个）参数为数组本身。 
初始 状态 ： int (索引） 

address (对象） 
address (数组引用) 

最终 状态. •一. 

aconst_null(0x1) - 压入数组常 ilnull 

概要： 将机器定义的常最 mill 作为地址压入操作数栈中。 

初始状 态：一 

最终 状态 ： address ( null ) 

aload<varnum>(0x19)[byte/short] - 从局部变■中加载地址 

概要: 从第 < vanuim > f 局部变量中加载地址（对象引用）并压入堆栈。在不使用宽 
( wide ) 操作数前缀的情况下， < v arnU m > 的值是一个0...255范围的 byte 。 否则为0…65536范围的 
short 。 注意： 子过程的返回地址不能够通过 aload 或其他操作码从存储 位置中 加栽。 

初始状 态：一 
最终状态 ： address 

aload_0(0x2a) — 从局部变置 0 加载地址 

板要： 从局部变量0中加载地址（对象引用）并压入堆栈中。此功能等价干 aload 0,但 
它占用的字节数更少且速度更快。 

初始状 态：- 
最终状态 ： address 


aastore(0x53) — 存储值到地址数组中 

概要： 将地址（数组引用）存储到同类型的地址数组中。 
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aload_1(0x2b) — 从局部变置 1 加载地址 

板要：从局部变量 I 中加载地址（对象引用）并压入堆栈中。此功能等价于 aload 1 ，但 
它占用的字节数更少且速度更快。 

初始状 态：- 
最终状态 ： address 

aload_2(0x2c) — 从局部变置 2 加载地址 

概要： 从局部变量 2 中加栽地址（对象引用）并压入堆栈中。此功能等价于 aload 2, 但 
它占用的字节数更少且速度更快。 

初始状 态：- 
最终状态 ： address 

aload_3(0x2d) —— 从局部变置 3 加载地址 

概要：从局部变最3中加载地址（对象引用）并压入堆栈中。此功能等价于 aload 3, 但 
它占用的字节数更少且速度更快。 

初始状 态：— 

最终状态 ： address 

anewarray<type>(Oxbd)[int] —— 创建一维对象数组 

概要: 为类型 S < type > m —维数组分配空间并将新数组的引用压人堆栈。字节码中的 type 
为常数池中的4字节索引。新数组的大小由从栈顶弹出的一个 integer 来表示。 

初始 状态 ： im (大小） 

最终状态 ： address (数 组） 

anewarray_quick(Oxde) —— anewarray 字节码的快速版本 

极要： Sun 公司的 JIT 编译器中内部使用的 anewarray 操作码的优化版本。这一操作码不 
会出现在目前未加栽和执行的 .cl ass 文件中。 

初始 状态： 参见 anewarray 操作码 
最终 状态：参见 anewarray 操作码 
areturn(OxbO) —— 从方法中返回地址结果 

板要： 从当前方法栈中弹出地址（对象引用），并将这一对象压入到调用者环境中的方法 
栈。当前方法被终止，控制转移到调用者环境。 

初始 状态 ： address 
最终 状态： （ n / a ) 

arraylength(Oxbe) —— 获得数组长度 

概要： 从堆栈中弹出数组（地址）并将此数组的长度 ( integer ) 压入堆栈。对于多维数 
组，返回的是第一维的长度。 

初始状态 ： address (数组）引用 
最终 状态 ： int 

astore<vamum>(0x3a)[byte/short] - 存健地址到局部变 11 中 

概要： 从堆栈中弹出一个地址（对象引用或子过程的返回 位置） 并将其存储到第 
< varnum > t 局部变量中。在不使用宽 (wide) 操作数前缀的情况下， < v arnura > 的值是一个 
0... 255范围的 byte 。 否则为 0... 65536范围的 short 。 

初始状态 ： address 
最终状态：一 
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astore_0(0x4b) — 存储地址到局部变置 0 中 

概要：从栈顶弹出一个地址（对象引用）并存储到局部变量 0 中。此功能等价于 astore 0, 
但它占用的字节数更少且速度更快。 

初始状态 ： address 
最终状 态：- 

astore_1 (0x4c) — 存糖地址到局部变置 1 中 

概要: 从栈顶弹出一个地址（对象引用）并存储到局部变量 1 中。此功能等价于 astore 1 ， 
但它占用的字节数更少且速度更快。 

初始 状态 ： address 
最终状 态：— 

astore_2(0x4d) — 存储地址到局部变置 2 中 

板要： 从栈顶弹出一个地址（对象引用）并存储到局部变量 2 中。此功能等价于 astore 2, 
但它占用的字节数更少且速度吏快。 

初始状态 ： address 
最终状 态：一 

astore_3(0x2e) - 存储地址到局部变置 3 中 

概要： 从栈顶弹出一个地址（对象引用）并存储到局部变 fi3 中。 此功能等价于 astore 3, 
但它占用的字节数更少且速度更快。 

初始状态 ： address 
最终状 态：一 

athrow(Oxbf) — 抛出异常/错误 

概要：从栈顶弹出一个地址（对象 引用） 并将此对象作为异常“抛给”预定义的句柄。 
此对象类型必须为 throwable 。 如果没有预定义的句柄，当前方法会终止，并在调用者环境中 
«新抛出此异常。这一过程会重复执行，直至找到句柄或没有调用者环％。若无调用者环境， 
进程/线程将会终止。若找到句柄，对象会压入到句柄的堆栈并将控制转移给句柄。 

初始 状态 ： address ( throwabic ) 

最终 状态： （ n / a ) 

baload(0x33) —— 从 byte 数组中加载值 

概要： 从堆栈中弹出一个数组和 integer , 取出一维 byte 数组中指定位置的值。取出的值转 
换为一个 integer 并压入找顶。 

初始状态 ： int (索引） 

address (数组 引用} 

最终 状态 ： int 

bastore(0x54) —— 存储值到 byte 数组中 

概要： 将8位的字节存储到 byte 数组中。顶端所弹出的参数为定义所用位罝的索引。第二 
个弹出的参数为需存储的 byte 值，第三个（最后一个）参数为数组本身。第二个参数从 int 截 
断为 byte 并存储在数组中。 

使用类似的语义， baload 也用于从 boolean 数组中加载值。 

初始状态 •• im (索引） 

int(byte 或 boolean ) 
address (数组引用） 

最终状 态：一 


188 附录 B JVM 指令集 


Bipush<constant>(0x10[byte]) - 压入 integer|byte 

概要: 作为参数的 byte 值 （-128 … 127) 符号扩展成一个 integer •后压入栈中。 

初始状 态：一 
最终 状态 ： int 

breakpoint(Oxca) — 断点（保留的操作码） 

权要： 这一操作码保留为 JVM 实现内部使用，通常用于支持调试功能。在类文件中出现 
此操作码将是非法的，这样的类文件也不能通过校验。 

初始 状态： ( n / a ) 

最终 状态： （ n / a ) 

caload(0x34) — 从 char 数组中加载值 

概要： 从堆栈中弹出一个数组和 integer ， 取出一维 char 数组中指定位置的值。取出的值转 
换为一个 integer 并压入栈顶。 

初始 状态 ： im (索引） 

address (数组引用） 

最终状态 ： int 

castore(0x54) —— 存储值到 char 数组中 

杈要：将16位的 UTF -16字符存储到 char 数组中。顶端所弹出的参数为定义数组位 W 的索 
引。第二个弹出的参数为需存储的 char 值，第三个（最后一个）畚数为数组本身。第二个参 
数从 im 鈸断为 char 并存储到数组中。 

初始 状态 ： int (索 引〉 
int ( char ) 

address (数组引用） 

最终状态：一 

checkcast<type>(OxcO [ 常数池索引])—确认类型是否兼容 

概要： 检査（但不弹出）栈顶元素以确认它是否为一个可转换为参数指定类型的地址 
(对象或数组引用）。换言之，对象或者为 null , 或者为< 17 ? 0 或<以 1 ) 0 父类的一个实例（参见 
instanceof )。 字节码中的 type 为常数池的2字节索引。如果类型不兼容，会抛出 Class Cast 
Exception 异常（参见 athrow )。 

初始状态 ： address 
最终 状态 ： address 

checkcast_quick(OxeO) - checkcast 字节码的快速版本 

概要： Sun 公司的 JIT 编译器中内部使用的 checkcast 操作码的优化版本。这一操作码不会 
出现在目前未加载和执行的 . cl ass 文件中。 

初始状态：参见 checkcast 操作码 
最终 状态： 参见 checkcast 操作码 
d2f(0x90 ) ——将 double 转换为 float 

概要： 从栈中弹出双字的 double ， 将其转换为单字的 float 并压入栈中。 

初始 状态 ： double 
double 

最终 状态 ： float 
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d2i(0x8e) -将 double 转换为 integer 

概要： 从栈中弹出双字的 double , 将其转换为单字的 integer ■并压入栈中。 

初始 状态 ： double 
double 

最终 状态 ： int 

d2l(0x8f) ——将 double 转换为 long 

概要:从栈中弹出双字的 cJouble , 将其转换为双字的丨 ong 并压入栈中。 

初始状态 ： double 
double 

最终 状态 ： long 
long 

dadd(0x63) - double 加法 

概要：从栈中弹出两个 double ， 计算其和并压入栈中。 

初始状态： double - 1 
double — 1 
double — 2 
double — 2 

最终 状态 ： double 
double 

daload(0x31) ——从 double 数组中加载值 

概要：从堆栈中弹出一个数组和 integer , 取出一维 double 数组中指定位置的值并压入栈顶。 

初始 状态 ： irn (索引） 

address (数组引用) 

最终 状态 ： double 
double 

dastore(0x52) ——存储值到 double 数组中 

概要：将双字的 double 存储到 double 数组中。顶端所弹出的参数为定义所用位置的索引。 
第二个/三个弹出的参数为需存储的 double 值，最后一个参数为数组本身。 

初始 状态 ： int (索引） 
double 
double 

address (数组引用） 

最终状 态：一 

dcmpg(0x98) ——比较 double. 在存在 NaN 的情况下返回 1 

概要: 将两个双字的 double 从操作数栈中弹出，将比较结果- 1，0 或 1 (作为一个 integer ) 
压入栈中。如果 double -2大于 double -1，将+1压入栈中，如果二者相等，将0压入栈中，否则 
的话将 -1 压入栈中。如果弹出的任意一个字或两个字解释为 double 时等于 IEEE NaN (非数字）， 
则将结果+1压入栈中。 

初始 状态： double -1 
double — 1 
double — 2 
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double—2 
最终 状态： int 

dcmpl(0x97) -比较 double. 在存在 NaN 的情况下返回 _1 

概要： 将两个双字的 double 从操作数栈中弹出，将比较结果一丨，0或1 (作 为—个 integer 〉 
压入栈中。如果 double -2 大于 double- 1, 将 +1 压入栈中，如果二者相等，将 0 压入栈中，否则 
的话将- 1 压入栈中。如果弹出的任意一个字或两个字解释为 double 时等于 IEEE NaN (非数字〉， 
则将结果 -1 压入栈中。 

初始 状态： double— 1 
double— 1 
double— 2 
double—2 
最终 状态： int 

dconst_0(0xe) ——压入 double 常量 0.0 

板要： 将 64 位 IEEE 双精度浮点数常最 0.0 压入操作数栈中。 

初始状 态 ：- 
最终 状态： double(O.O) 
double(O.O) 

dconstj (Oxf) ——压入 double 常置 1.0 

板要： 将64位 IEEE 双楕度浮点数常量 1.0 压入操作数 栈中。 

初始状态 ：- 
最终 状态： double( 1.0) 
double(l.O) 

ddiv(0x6f) - double 除法 

板要： 弹出两个双字的双精度浮点数，并将 double -丨除 double - 2 的结果压入栈中。 

初始状态： double— 1 
double— 1 
double— 2 
double— 2 
最终 状态： double 
double 

d!oad<varnum>(0x18[byte/short]) -从局部变置中加载 double 

概要： 从第 <varmim>*<varnum>+l 个局部变量中加栽双字的双精度浮点数并压入堆栈。 
在不使用宽 ( wide ) 操作数前缀的情况下， < V anuim> 的值是一个0...255范围的 byte。 否则为 
0... 65536范围的 short。 

初始状 态 ：- 
最终状态： double 
double 

dload_0(0x26) ——从局部变置0/1加载 double 

概要： 从局部变量0和1中加载双精度浮点数并压入堆栈中。此功能等价于 dload 0,但它 
占用的字节数更少且速度更快。 

初始状 态 ：- 
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最终 状态 ： double 
double 

dload _1(0 x 27) ——从局部变置 1/2 加载 double 

概要： 从局部变量 1 和 2 中加栽双精度浮点数并压入堆栈中。此功能等价于 dload 1, 但它 
占用的字节数更少且速度更快。 

初始状 态：一 

最终状态 ： double 
double 

dload _2(0 x 28) —从局部变置2/3加载 double 

概要： 从局部变量 2 和 3 中加载双精度浮点数并压入堆栈中。此功能等价于 dload 2, 但它 
占用的字节数更少且速度更快。 

初始状态：一 

最终 状态 ： double 
double 

dload _3(0 x 29) ——从局部变置 3/4 加载 double 

概要： 从局部变置 3 和 4 中加教双精度浮点数并压入堆栈中。此功能等价于 dload 3, 但它 
占用的字节 数吏少 且速度 更快。 

初始状 态：一 

最终状态 ： double 
double 

dmul (0 x 6 b ) - double 乘法 

概要： 弹出两个双字的双精度浮点数，并将二者的乘积压入栈中。 

初始状态： double- 1 
double— 1 
double— 2 
double— 2 

最终 状态 ： double 
double 

dneg (0 x 77) - double 求反 

板要： 弹出一个双字的双精度浮点数，符号求反（乘以- 1) 后压入栈中。 

初始 状态 ： double 
double 

最终状态 ： double 
double 

drem (0 x 73) - double 求余 

概要： 弹出两个双字的双精度浮点数，并将 double -1 除 double -2 的余数压入梭中。 

初始状态： double- 1 
double— 1 
double— 2 
double— 2 

最终状态 ： double 
double 
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dreturn ( OxbO ) -从方法中返回 double 

概要： 从当前方法栈中弹出双字的双精度浮点数并压入到调用者环境中的方法栈。当前 
方法被终止，控制转移到调用者环境。 

初始状态 ： double 
double 

最终 状态： （ n / a ) 

dstore < varnum >(0 x 39)[ byte / short ] -存储 double 到局部变置中 

概要: 从堆找中弹出一个 double 并将其存储到第 < varnum >*< varnum >+ l 个局部变量中。 
在不使用宽 (wide) 操作数前缀的情况下， < vanuim > 的值是一个0...255范围的 byte 。 否则为 
0... 65536范围的 short 。 

初始状态 ： double 
double 
最终状 态：一 

dstore _0(0 x 47) ——存储 double 到局部变置0/1中 

概要： 从栈顶弹出一个 double 并存储到局部变 *0 和 1 中。 此功能等价于 dstore 0, 伹它 
占用的字节数更少且速度更快。 

初始 状态 ： double 
double 

最终状 态：一 

dstore _1(0 x 48) ——存储地址到局部变最 1/2 中 

概要： 从栈顶弹出一个 double 并存储到局部变 ftl 和2中。此功能等价于 dstore 1， 但它 

占用的字节数更少且速度更快。 

初始状态 ： double 
double 
最终状态：一 

dstore _2(0 x 49) ——存储 double 到局 部变量 2/3中 

概要： 从栈顶弹出一个 double 并存储到局部变 ft 2 和3中。此功能等价于 dstore 2,但它 
占用的字节数更少且速度更 :快。 

初始 状态 ： double 
double 
最终状 态：一 

dstore _3(0 x 4 a ) -存储 double 到局部变置 3/4 中 

概要： 从栈顶弹出一个 double 并存储到局部变 ft 3 和 4 中。此功能等价于 astore 3, 但它 
占用的字节数更少且速度更快。 

初始 状态 ： double 
double 

最终状态：一 

dsub (0 x 67) - double 减法 

概要：弹出两个双字的双精度浮点数，并将 double - 2 减 double -1的结果压入栈中。 

初始状态： double - 1 
double — 1 
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double —2 
double —2 
最终 状态： double 
double 

dup (0 x 59) —复制栈顶的字 
撅要：复制栈顶的一个字并压入栈中。 

初始 状态： word -1 
最终 状态： word -1 
word — 1 

dup 2(0 x 5 c ) —复制栈顶的两个字 

梭要： 复制栈顶的两个字并压入栈中。被复制的项可以是两个独立的单字项（如 int 、 
float 或地址）或一个双字项（如 long 或 double )。 

初始 状态： word -1 
word -2 
最终状态： word -1 
word —2 
word — 1 
word — 2 

dup 2_ x 1(0 x 5 d ) ——复制栈顶的两个字并插入到第三个字的下面 
概要： 复制栈顶的两个字并插入到第三个字的下面，作为第四和第五个字。被复制的项 
可以是两个独立的单字项（如 int 、 float 或地址）或一个双字项（如 long 或 double )。 

初始 状态： word -1 
word — 2 
word — 3 
最终状态： word -1 
word —2 
word —3 


word —1 
word — 2 


dup 2_ x 2(0 x 5 e ) ——复制栈顶的两个字并插入到第四个字的下面 

概要： 复制栈顶的两个字并插入到第四个字的下面，作为第五和第六个字。被复制的项 


可以是两个独立的单字项（如 int 、 float 或地址）或一个双字项（如 long 或 double )。 
初始状态： word -1 
word —2 
word —3 


word —4 
最终 状态： word -1 
word —2 
word —3 
word — 4 



word — 2 
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dup _ x 2(0 x 5 a ) -复制栈顶的一个字并插入到第二个字的下面 

概要：复制栈顶的一个字并插入到第二个字的下面，作为第三个字。 

初始 状态： word — 1 
word —2 
最终 状态： word -1 
word —2 
word — 1 

dup _ x 2(0 x 5 b ) ——复制栈顶的一个字并插入到第三个字的下面 
概要： 复制栈顶的一个字并插入到第三个字的下面，作为第四个字。 

初始 状态： word - 1 
word —2 
最终状态： word -1 
word — 2 
word — 1 

f 2 d (0 x 8 d ) ——将 float 转换为 double 

概要： 从栈中弹出单字的 float 浮点数，将其转换为双字的 double 并压入栈中。 

初始 状态 ： float 
最终 状态 ： double 
double 

f2i ( 0x8b ) ——将 float 转换为 int 

橛要： 从栈中弹出单字的 float 浮点数，将其转换为单字的 integer 并压入栈中。 

初始 状态 ： float 
最终 状态 ： int 

f 2 l (0 x 8 c ) —将 float 转换为 long 

概要： 从栈中弹出单字的 float 浮点数，将其转换为双字的 kmg 并压入栈中。 

初始 状态 ： float 
最终 状态 ： long 
long 

fadd (0 x 62 ) —— float 加法 

概要： 从栈中弹出两个 float ， 计算其和并压入栈中。 

初始 状态 ： float 
float 

最终状态 ： float 

faload (0 x 30) ——从 float 数组中加载值 

概要：从堆栈中弹出一个数组和 integer , 取出一维 float 数组中指定位置的值并压入栈顶。 
初始状态 ： int (索引） 

address (数组引用) 

最终 状态 ： float 

fastore (0 x 51) ——存储值到 float 数组中 

概要： 将单字的 float 存储到 float 数组中。顶端所弹出的参数为定义所用位置的索引。第二 
个弹出的参数为需存储的 float 值，第三个（最后一个）参数为数组本身。 
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初始 状态 ： int (索引） 
float 

address (数组引用) 



fcmpg (0 x 96) -比较 float . 在存在 NaN 的情况下返回1 

板要：将两个单字的 float 从操作数栈中弹出，将比较结果-1, 0或1 (作为一个 integer ) 
压入栈中。如果 float -2大于 float -1，将+ 1 压入栈中，如果二者相等，将 0 压入栈中，否则的 
话将-1压入栈中。如果弹出的任意一个字或两个字解释为浮点数时等于 IEEE NaN (非数字）， 
则将+1压入栈中。 

初始 状态： float -1 
float —2 
最终状态： int 

fcmpl (0 x 95) -比较 float . 在存在 NaN 的情况下返回 -1 

杈要： 将两个单字的 float 从操作数栈中弹出，将比较 结果- 1, 0或1 (作为一个 integer ) 
压入栈中。如果 float -2大于 float - 1 ，将+ 1 压入栈中，如果二者相等，将 0 压入栈中，否则的 
话将 -1 压入栈中。如果弹出的两个字或其中的任意一个解释为浮点数时等于 IEEE NaN (非数 
字），則将 -1 压入栈中。 

初始状态： float -1 
float —2 
最终状态： int 

fconstJD ( Oxb ) ——压入 float 常量 0.0 

板要：将32位 IEEE 的浮点数常釐 0.0 压入操作数栈中。 

初始状 态：- 

最终 状态： float ( O . O ) 

fconsM ( Oxc ) ——压入 float 常 • 1.0 

概要：将32位 IEEE 的浮点数常 i 1.0 压入操作数栈中。 

初始状 态：一 

最终 状态： float ( l . O ) 

fconst _2(0 xd ) ——压入 float 常置2.0 

杈要：将32位 IEEE 的浮点数常量 2.0 压入操作数栈中。 

初始状 态：- 
最终 状态： float (2.0) 
fdiv (0 x6e ) - float 除法 

梭要： 弹出两个单字的浮点数，并将 float -1除 float -2的结果压入栈中。 

初始 状态： float -1 
float — 1 
float -2 
float — 2 

最终状态： float 
float 
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fload < vamum >( 0x1 7[ byte / short ]) -从局部变量中加载 float 

概要： 从第 < vanuim > 个局部变量中加载单字的 fl oat 浮点数并压入堆栈。在不使用宽 
(Wide) 操作数前缀的情况下， < varnum > 的值是一个0...255范围的 byte 。 否则为0...65536范围的 
short 0 

初始状 态：一 
最终状态： float 
fmul (0 x6a ) - float 乘法 

概要 •• 弹出两个单字的 float 浮点数，并将二者的乘积压入栈中。 

初始 状态： float 
float 

最终状态： float 
float 

fload _0(0 x22 ) ——从局部变量 0 加载 float 

板要： 从局部变 *0 中加载单字 float 浮点数并压入堆栈中。此功能等价于 fload 0, 但它 
占用的字节数更少且速度更快。 

初始状 态：- 
最终 状态： float 

fload .1(0 x 23) ——从局部变量1加载 float 

橛 要： 从局部变 SU 中加栽单字 float 浮点数并压入堆栈中。此功能等价于 fload 1， 但它 
占用的字节数更少且速度吏快。 

初始状 态：- 
最终 状态： float 

fload _2(0 x 24) —从局部变量2加载 float 

板要：从局部变量2中加栽单字 float 浮点数并压入堆栈中。此功能等价于 fload 2, 但它 
占用的字节数更少且速度更快。 

初始状态：- 
最终 状态： float 

fload _3(0 x 25) ——从局部变量3加载 float 

概要：从局部变量 3 中加载单字 float 浮点数并压入堆栈中。此功能等价于 fload 3,但它 
占用的字节数更少且速度更快。 

初始状 态：- 
最终状态： float 
fneg (0 x 76) - float 求反 

概要： 弹出一个 float 浮点数，符号求反（乘以- 1) 后压入栈中。 

初始 状态： float 
最终 状态： float 
frem (0 x 72 ) —— float 求余 

概要： 弹出两个单字的 float 浮点数，并将 float -1除 float -2的余数压入栈中。 

初始 状态： float — 1 
float —2 

最终 状态： float 
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freturn ( Oxae ) -从方法中返回 float 

概要： 从当前方法栈中弹出单字的 float 浮点数并压入到调用者环境中的方法栈。当前方 
法被终止，控制转移到调用者环境中。 

初始 状态 ： float 
最终 状态： （ n / a ) 

fstore < varnum >(0 x 38)[ byte / short ] -存储 float 到局部变置中 

板要： 从堆栈中弹出一个 float 并将其存储到第<乂31^11111>个局部变董中。在不使用宽 
( Wide ) 操作数前缀的情况下， < V anuim > 的值是一个0...255范围的 byte 。 否则为 0... 65536范围的 
short 0 

初始状态 ： float 
最终状 态：一 

fstore .0(0 x 43) —存储 float 到局部变置0中 

概要： 从栈顶弹出一个 float 并存储到局部变董 0 中.此功能等价于 fstore 0,但它占用的 
字节数更少且速度更快。 

初始 状态 ： float 
最终状 态：一 

fstore _1(0 x 44) —存储 float 到局部变量1中 

梭要： 从栈顶弹出一个 float 并存储到局部变址1中。此功能等价于 fstore 1,但它占用的 
字节数更少且速度更快。 

初始 状态 ： float 
最终状态：一 

fstore _2(0 x 45) —存储 float 到局 部变置 2中 

梭要：从栈顶弹出一个 float 并存储到局部变中，此功能等价于 fstore 2,但它占用的 
字节数更少且速度更快。 

初始 状态 ： float 
最终状 态：一 

fstore _3(0 x 46) —存储 f I oat 到局部变置 3 中 

概要： 从栈顶弹出一个 float 并存储到局部变量*3中《此功能等价于 fstore 3,但它占用 
的字节数更少且速度更快。 

初始 状态 ： float 
最终状 态：一 
fsub (0 x 67 ) —— float 减法 

板要：弹出两个单字的 float 浮点数，并将 float -2减 float -1的结果压入栈中。 

初始 状态： float- 1 
float— 2 

最终 状态 ： float 

getfield < fieldname >< type >(0 xb 4[ short ][ short ]) -获得对象域 

概要： 从堆栈中弹出一个地址（对象引用），获得指定域值并压入栈中。 getfield 操作码 
带有两个参数，域标识符和域类型，它们作为2个字节的常数池索引存储在字节码中。不同于 
Java 的是，域名必须完全限定，包括相关的类和包名。 

初始 状态： 地址（对象） 
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最终状 态：值 

getfield2 _ quick (0 xd0 ) ——用于双字域的 getf 1 el d 的快速版本 

概要: Sun 公司的 JIT 编译器中内部使用的 getfleld 操作码的优化版本。这一操作码不会 
在目前未加载和执行的 . class 文件中出现。 

初始 状态： 参见 getfield 操作码 
最终 状态： 参见 getfield 操作码 
getfield _ quick ( Oxce) —— getflel d 操作码的快速版本 

概要： Sun 公司的 JIT 编译器中内部使用的 getfield 操作码的优化版本。这一操作码不会 
在目前未加载和执行的 .cl ass 文件中出现。 

初始 状态： 参见 getfield 操作码 
最终 状态： 参见 getfield 操作码 
getfield _ quick _ w (0 xe 3) - getfield 的快速宽版本 

概要： Sun 公司的 JIT 编译器中内部使用的 getfield 操作码的优化版本。这一操作码不会 
在目前未加栽和执行的 .cl ass 文件中出现。 

初始 状态： 参见 getfield 操作码 
最终 状态： 参见 getfield 操作码 

getstatic < fieldname >< type >(0 xb2 [ short ][ short ]) -获得类域 

梭要： 获得指定类域的值并压入栈中。 getstatlc 操作码带有两个参数，域标识符和域类 
型，它们作为 2 个字节的常数池索引存储在字节码中。不同于 Java 的是，域名必须完全限定， 
包括相关的类和包名。 

初始状态：一 
最终状态：值 

getstatic _ quick (0 xd2 ) - getstatlc 操作码的快速版本 

概要： Sim 公司的 JIT 编译器中内部使用的 getstatlc 操作码的优化版本。这一操作码不 
会在 B 前未加栽和执行的 . class 文件中出现。 

初始 状态： 参见 getstatlc 操作码 
最终 状态： 参见 getstatlc 操作码 

getstatic 2_ quick (0 xd 4) -用于2字节 getstatlc 操作码的快速版本 

概要: Sun 公司的 JIT 编译器中内部使用的 getstatlc 操作码的优化版本。这一操作码不 
会在目前未加载和执行的 . class 文件中出现。 

初始状态：参见 getstatlc 操作码 
最终状态：参见 getstatlc 操作码 
goto < label >(0 xa 7[ short ]) —无条件跳转到 label 处 

概要：无条件地将控制转移到 <label> 标识的位置。在指令字节码中，操作码的后面是相 
对千当前 PC 值的两个字节的偏移量。如果标识的偏移量大于两个字节的表示，可以使用 
goto _ w 。 jasmin 汇编器能够基于偏移置的分析决定使用哪个操作码。 

初始状 态：一 
最终状 态：一 

goto _ w < label >(0 xa 7[ short ]) ——使用宽 偏移置 无条件跳转到 label 处 
概要： 无条件地将控制转移到 < label > 标识的位置。在指令字节码中，操作码的后面是相 
对于当前 PC 值的四个字节的偏移量。使用此操作码，可以跳转到超过32 767字节的偏移量处。 
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jasmin 汇编器能够基于偏移董的分析自动决定使用 goto 还是 g 0 to _ w 操作码。 

初始状 态：- 
最终状 态：一 

i 2 b (0 x 91) ——将 integer 转换为 byte 

概要： 从栈中弹出单字的 integer , 将其截断为一个 byte (0 …255)，高位填0扩展为 32 bit , 并 
压入栈中（作为一个 integer )。 

初始 状态： int 
最终 状态 ： im 

i 2 c (0 x 87) —将 integer 转换为 char 

概要 •• 从栈中弹出单字的 integer , 将其截断为一个两字节的 UTF -16 char , 髙位填0扩展 
为 32 bit , 并压入栈中（作为一个 integer )。 

初始状态： int 
最终 状态 ： im 

i 2 d (0 x 87) ——将 integer 转换为 double 

概要： 从栈中弹出单字的 integer , 将其转换为双字的 double 并压入栈中。 

初始 状态： integer 
最终状态： double 
double 

i2f (0 x86 ) ——将 integer 转换为 float 

概要： 从栈中弹出单字的 integer , 将其转换为单字的浮点数并压入栈中。 

初始 状态： integer 
最终 状态： float 

i 2 l (0 x 85) -将 integer 转换为 long 

概要： 从栈中弹出单字的 integer , 将其符号扩展为一个双字的 long 并压入栈中。 

初始 状态： int 
最终 状态： long 
long 

i 2 s (0 x 93) ——将 integer 转换为 short 

概要：从栈中弹出单字的 integer , 将其截断为一个有符号的 short (-32768… 32767) 并符号 
扩展为 32 bit , 压入找中（作为一个 integer )。 

初始 状态： int 
最终 状态： int 
iadd (0 x 60) - integer 加法 

板要： 从栈中弹出两个 integer , 计算其和并压入栈中。 

初始 状态： int 
int 

最终 状态： int * 

iaload (0 x2e ) 从 integer 数组中加载值 

概要： 从堆栈中弹出一个数组和 integer , 取出一维 integer 数组中指定位置的值并压入 
栈顶。 

初始 状态： int (索引） 
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address (数组引用） 

最终 状态 ： int 

iand (0 x 7 e ) - integer 逻辑与 

te 要：从栈中弹出两个 integer ， 计算位与的结果，并将32- bit 的 integer 结果压入栈中。 
初始 状态 ： int 
int 

最终 状态 ： int 

iastore (0 x 4 f ) ——存储值到 integer 数组中 

概要： 将单字的 integer 存储到 integer 数组中 • 顶端所弹出的参数为定义所用位置的索引。 
第二个弹出的参数为需存储的 integer 值，第三个（最后一个）参数为数组本身。 

初始 状态 ： int (索引） 
int (值） 

address (数组引用） 



iconstj )(0 x 03) —— 压入 integer 常置0 

概要： 将32- bit 的 integer 常 ftO ( OxO ) 压入操作数栈中。 

初始状态：- 

最终 状态： int ( O ) 

iconst^l (0 x 4) - 压入 integer 常量1 

板要： 将32- bit 的 integer 常置 1 (0 x 1) 压入 操作数 栈中。 
初始状态：- 
最终 状态： int ( l ) 

iconst __2(0 x 5) - 压入 integer 常量2 

梭要： 将32- bit 的 integer 常量2 (0 x 2) 压入操作数栈中。 
初始状态：一 
最终 状态: int (2) 

iconst _3(0 x 6) - 压入 integer 常置3 

板要： 将32- bit 的 integer 常量 3 (0 x 3) 压人操作数栈中， 
初始状态：一 
最终 状态: int (3) 

iconst __4(0 x 7) —— 压入 integer 常置4 

概要： 将 32- bit 的 integei ■常 fl 4 (0 x 4) 压入操作数栈中。 

初始状 态：- 

最终 状态: int (4) 

iconst __5(0 x 8) - 压入 integer 常置5 

板要： 将 3 2- bit 的 integer •常量 5 (0 x 5) 压入操作数栈中。 
初始状 态：- 
最终 状态： int (5) 

iconst—m 1(0 x2 ) - 压入 integer 常置一 1 

概要： 将 32- bit 的 integer 常量- 1 ( OxFFFF ) 压入操作数栈中。 
初始状态.•- 
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最终状态: int (- l ) 
idiv (0 x6c ) - integer 除法 

概要: 弹出两个单字的 integer 浮点数，并将 integer -1除 integer -2的结果压入栈中。 

初始 状态： int -1 
int -2 

最终 状态 ： int 

ILacmpeq <! abel >(0 xa 5[ short ]) ——比较地址.相等则嫌转 
要：将两个地址（对象引用）从操作数栈中弹出，如果二者相等，控制转移到 < label > 
处。在内部，操作码后为2个字节的偏移量。当产生跳转时，偏移量会加到当前的 PC 值上。 
初始 状态 ： address 
address 
最终状 态：一 

if _ acmpne < label >(0 xa6 [ short ]) ——比较地址 • 不相等则跳转 

桃要： 将两个地址（对象 引用） 从操作数栈中弹出，如果二者不相等，控制转移到 
< label >&。 在内部，操作码后为2个字节的偏移置。当产生跳转时，偏移量会加到当前的 PC 
值上。 

初始 状态 ： address 
address 
最终状 态：一 

ifjcmpeq < label >(0 x 9 f [ short ]) ——比较 integer , 相等则跳转 

概要： 将两个 integer 从操作数栈中弹出，如果二者相等，控制转移到 < label >& 0 在内部， 
操作码后为2个字节的偏移量。当产生跳转时，偏移最会加到当前的 PC 值上。 

初始状态 ： int 
int 

最终状态：一 

if _ icmpge < label >(0 xa2 [ short ]) ——比较 integer . 大于等于则跋转 

板要： 将两个 integer 从操作数栈中弹出，如果倒数第二个元素大于等于栈顶元素，控制 
转移到 < label >&。 在内部，操作码后为2个字节的偏移量。当产生跳转时，偏移量会加到当前 
的 PC 值上。 

初始 状态 ： int 


最终状态：一 

ifjcmpgt < label >(0 xa 3[ short ]) -比较 integer . 大于则跳转 

概要： 将两个 integer 从操作数栈中弹出，如果倒数第二个元素大于栈顶元素，控制转移 
到 < label >&。 在内部，操作码后为2个字节的偏移最。当产生跳转时，偏移量会加到当前的 
PC 值上。 

初始 状态 ： int 
int 

最终状 态：- 


ifjcmple < label >(0 xa2 [ shortj ) -比较 integer . 小于等于则雄转 

板要： 将两个 integer 从操作数栈中弹出，如果倒数第二个元素小于等于栈顶元素，控制 
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转移到 < Iabel >&。 在内部，操作码后为2个字节的偏移量。当产生跳转时，偏移量会加到当前 
的 PC 值上。 

初始 状态： int » 


ifjcmplt < label >(0 xa1 [ short ]) ——比较 integer . 小于则跳转 

概要：将两个 integer 从操作数栈中弹出，如果倒数第二个元素小于栈顶元素，控制转移 
到 < label >&。 在内部，操作码后为2个字节的偏移量。当产生跳转时，偏移量会加到当前的 
PC 值上。 

初始 状态 ： int 
int 

最终状 态：一 

ifJcmpne < label >( OxaO [ short ]) -比较 integer . 不相等则跳转 

概要： 将两个 integer 从操作数栈中弹出，如果二者不相等，控制转移到 < label > 处。在内 
部，操作码后为2个字节的偏移贵。当产生跳转时，偏移 ft 会加到当前的 PC 值上。 

初始 状态 ： int 
int 

最终状 态：一 

ifeq < label >(0 x 99[ shortj ) ——相等则跳转 

概要： 将一个 integer 从操作数栈中弹出，如果等于0,控制转移到 < label > 处。在内部，操 
作码后为2个字节的偏移 ft 。 当产生跳转时，偏移置会加到当前的 PC 值上。 

初始 状态 ： int 
最终状 态：一 

ifge < label >(0 x 9 c [ shortj ) ——大于等于则跳转 

概要： 将一个 integer 从操作数栈中弹出，如果大于等干0,控制转移到 < label >&。 在内部， 
操作码后为2个字节的偏移 ft。 当产生跳转时，偏移量会加到当前的 PC 值上。 

初始 状态 ： int 
最终状 态：一 

iLgt < label >(0 x 9 d [ shorlJ ) -大于则跳转 

概要： 将一个 integer 从操作数栈中弹出，如果大于0,控制转移到 < label > 处。在内部，操 
作码后为2个字节的偏移量。当产生跳转时，偏移量会加到当前的 PC 值上。 

初始状态 ： int 
最终状 态：- 

ifje < label >(0 x 9 e [ short ]) ——小子等子则跳转 

板要： 将一个 integer 从操作数栈中弹出，如果小于等于0,控制转移到 < label >&。 在内部， 
操作码后为2个字节的偏移量。当产生跳转时，偏移量会加到当前的 PC 值上。 

初始 状态 ： int 
最终状 态：一 

ifjt < label >(0 x 9 b [ short ]) ——小于则跳转 

概要： 将一个 integer 从操作数栈中弹出，如果小于0,控制转移到 < labe [> 处。在内部，操 
作码后为2个字节的偏移量。当产生跳转时，偏移量会加到当前的 PC 值上。 
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初始 状态： int 
最终状态：— 

if _ ne < label >(0 x 9 a [ short ]) ——不相等则跳转 

梭要： 将一个 integer 从操作数栈中弹出，如果不等于0,控制转移到 < label > 处。在内部， 
操作码后为2个字节的偏移量。当产生跳转时，偏移量会加到当前的 PC 值上。 

初始 状态： int 
最终状 态：一 

if _ nonnull < label >(0 xc 7[ short ]) -不为 null 则跳转 

梭要：将一个地址（对象 引用） 从操作数栈中弹出，如果不为 null ， 控制转移到 < label > 处。 
在内部，操作码后为2个字节的偏移量。当产生跳转时，偏移董会加到当前的 PC 值上。 

初始 状态： address 
最终状 态：一 

ifnull < label >(0 xc6 [ short ]) -为 null 则跳转 

梭要： 将一个地址（对象 引用） 从操作数栈中弹出，如果为 mill , 控制转移到 < label >&。 
在内部，操作码后为2个字节的偏移 釐 。 当产生跳转时，偏移最会加到当前的 PC 值上。 

初始 状态： address 
最终状态：一 

iinc < varnum > < increment > (0 x 84[ byte / short ] [ byte / short ]) -递增局部变置中的 

integer 

梭要： 将包含一个 增置的 局部变 M 递增。第一个参数定义要调整的局部变》编号，第二 
个参数为所调整的有符号常量。第一个参数的范围为 0... 255,第二个参数的范围为 -128... 127。 
如果使用 wide 前缀，第一个参数的范围为0…65536,第二个参数的范围为- 32768... 32767。堆 
栈不发生变化。 

初始状 态：- 
最终状 态：一 

iload < varnum >(0 x 15[ byte / shortJ ) -从局部变 It 中加载 integer 

梭要： 从第 < V anuim > 个局部变量中加载单字的 integer 并压入堆栈。在不使用宽 ( wide ) 操 
作数前缀的情况下， < vamum > 的值是一个0...255范围的 byte 。 否則为 0... 65536范围的 short c 
初始状 态：- 
最终 状态： im 

iload _0(0 x1a ) —从局部变置0加载 integer 

概要： 从局部变量0中加载单字 integer 并压入堆栈中。此功能等价于 lload 0 ,但它占用 
的字节数更少且速度更快。 

初始状 态：一 
最终状态 ： int 

iloadj (0 x1 b ) —从局部变置1加载 integer 

概要：从局部变 董1 中加载单字 integer 并压入堆栈中。此功能等价于1 load 1，但它占用 
的字节数更少且速度更快。 

初始状 态：- 
最终 状态： int 
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iload 一 2(0 x1c ) —从局部变量 2 加载 integer 

棱要： 从局部变量2中加载单字 integer 并压入堆栈中。此功能等价于 iload 2，但它占用 
的字节数更少且速度更快。 

初始状 态：- 
最终 状态 ： int 

iload _3(0 x 1 d ) —从局部变置3加载 integer 

板要: 从局部变量3中加载单字 integer 并压入堆栈中。此功能等价于 Iload 3,但它占用 
的字节数更少且速度更快。 

初始状态：一 
最终状态 ： irn 

imdepl ( Oxfe ) ——保留的操作码 

杈要：这一操作码保留为 JVM 实现的内部使用。这一操作码出现在 .class 文件中是非法 
的并且这样的类文件会校验失败。 

初始 状态： （ n / a ) 

最终 状态： （ n / a ) 

imdep2 (0 xff ) —保留的操作码 

概要: 这一操作码保留为 JVM 实现的内部使用。这一操作码出现在 .class 文件中是非法 
的并且这样的类文件会校验失败。 

初始 状态： ( n / a ) 

最终 状态： ( n / a ) 
imul (0 x68 ) - integer 乘法 

概要： 弹出两个 integer ， 并将二者的乘积压入栈中 a 
初始 状态 ： int 
int 

最终 状态 ： int 
ineg (0 x 74) - integer 求反 

概要 •• 弹出一个 integer , 符号求反（乘以一 1) 后压入栈中。 

初始 状态 ： int 
最终 状态 ： int 

instanceof < type >(0 xc1 [ short ]) —检测对象 / 数组是否为指定类型 
板要： 从栈中弹出一个地址（对象或数组引用）并判断是否同指定的 type 兼容-或者为 
type 的实例，或者实现了那一接口，或者为 type 父类的实例。如果兼容，压入整数1，否则压 
入 0 o 

初始 状态 ： address 
最终 状态 ： int 

instanceof _ quick (0 xe1 ) - instanceofJi 作码的快速版本 

概要 ： Sun 公司的 JIT 编译器中内部使用的 instanceof 操作码的优化版本。这一操作码不 
会在目前未加载和执行的 .class 文件中出现。 

初始状态; 参见 instanceof 操作码 
最终状态：参见 Instanceof 操作码 
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invokeinterface < method >< Nargs >(0 xb 9[ short ] [ byte ] [ byte ]) -调用接口方法 

板要：调用接口（相对于类）中定义的方法。 Invokeinterface 的参数包括被调用方法的 
完全限定名（包括接口名、参数类型和返回类型）和参数个数。这些参数和实现接口的对象 
地址（对象 引用） 一起从栈中弹出。一个新的栈帧会为被调用环境创建，同时对象和参数也 
会压入环境栈中，控制转移到新的方法/环境。在方法返回时，返回值（由 return 给出）会压 
入到调用者环境栈中。 

在字节码中，方法名为两个字节的常数池（参见词汇表）索引。下一个字节为参数的个 
数（以字为单位），最多可达 255 个。在下一个字节存储值 0, 在 JVM 内部可用来存储哈希值以 
加快方法的査找速度。 

初始 状态 ： argN 

攀參參 

arg 2 

argl 

address (对 象） 

最终 状态： （结果） 

invokeinterface _ quick ( Oxda ) -1 nvokel nterf ace 操作码的快速版本 

概要 •• Sun 公司的 JIT 编译器中内部使用的 Invokelnterface 操作码的优化版本。这一操 
作码不会在目前未加栽和执行的 .cl ass 文件中出现。 

初始 状态： 参见 Invokelnterface 操作码 
最终 状态： 参见 Invokelnterface 操作码 

invokenonvirtual _ quick ( Oxda ) -1 nvokespeclal 搡作码的快速版本 

板要： Sun 公司的 JIT 编译器中内部使用的 Invokespeclal 操作码的优化版本。这一操作 
码不会在目前未加载和执行的 • cl ass 文件中出现。 

初始状态： 参见 Invokespeclal 操作码 
最终 状态： 参见 invokespeclal 操作码 

invokespecial < method > (0 xb 7[ shortJ ) -调用实例方法 

板要：在下述情况下使用 Invokespeclal 调用对象中的实例 方法： 

• 实例初始化方 

• this 的私有方法 

• this 父类中的方法 

这一操作码类似于 Invokevlrtual 。 Invokespeclal 的参数包括调用方法的完全限定名 
(包括接口名、参数类型和返回类型）和参数个数。这些参数和相关类的实例地址（对象引用） 
一起从栈中 弹出。 一个新的栈桢会为被调用环境创建，同时对象和参数也会压入环埦栈中， 
控制转移到新的方法/环境。在方法返回时，返回值（由 return 给出）会压入到调用者环境栈 
中。在字节码中，方法名为两个字节的常数池（参见词 汇表） 索引。 

初始 状态 ： argN 


arg 2 

argl 

address (对象） 
最终 状态： （结果） 
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invokestatic < method > (0 xb 8[ short ]) -调用静态方法 

梭要： 调用类的静态方法。 Invokestatlc 的参数包括调用方法的完全限定名（包括接口 
名、参数类型和返回类型）和参数个数。这些参数从栈中弹出。一个新的栈帧会为被调用环 
境创建，同时对象和参数也会压入环境栈中，控制转移到新的方法/环境。在方法返回时，返 
回值（由 return 给出）会压入到调用者环境栈中。在字节码中，方法名为两个字节的常数池 
(参见词汇表）索引。 

初始 状态： argN 

arg2 

argl 

最终 状态： （结果） 

invokestatic 一 quick (0 xd 9) - invokestatlc 操作码的快速版本 

概要： Sun 公司的 JIT 编译器中内部使用的 invokestatlc 操作码的优化版本。这一•操作码 
不会在目前未加载和执行的 . cl ass 文件中出现。 

初始 状态： 参见 Invokestatic 操作码 
最终 状态： 参见 Invokestatlc 操作码 

invokesuper _ quick ( 0xd8 ) —— invokespecial 操作码的快速版本 

概要： Sun 公司的 JIT 编译器中内部使用的 invokespecial 操作码的优化版本。这—操作码 
不会在目前未加载和执行的 .cl ass 文件中出现。 

初始 状态： 参见 Invokespecial 操作码 
最终 状态： 参见 Invokespecial 操作码 
invokevirtual < method > (0 xb 6[ short ]) -调用实例方法 

概要： 调用对象的实例方法。 Invokevlrtual 的参数包括调用方法的完全标识名（包括接 
口名、参数类型和返回类型）和参数个数。这些参数和相关类的实例地址（对象引用）一起 
从栈中弹出。一个新的栈帧会为被调用环境创逮，同时对象和参数也会压入环境栈中，控制 
转移到新的方法/环境。在方法返回时，返回值（由 return 给出）会压入到调用者环境栈中。 
在字节码中，方法名为两个字节的常数池（参见词汇表）索引。 

初始 状态： argN 

arg2 

argl 

address (对象） 

最终 状态： （结果） 

invokevirtuaLquick (0 xd 6) - Invokevlrtual 搡作码的快速版本 

概要： Sun 公司的 JIT 编译器中内部使用的 Invokevlrtual 操作码的优化版本。这一操作 
码不会在目前未加载和执行的 .class 文件中出现。 

初始 状态： 参见 Invokevlrtual 操作码 
最终 状态： 参见 Invokevlrtual 操作码 

invokevirtual _ quick _ w (0 xe 2) —— Invokevlrtual 操作码的快速版本（宽索引） 

概要： Sun 公司的 JIT 编译器中内部使用的 Invokevlrtual 操作码的优化版本。这一操作 
码不会在目前未加栽和执行的 • cl ass 文件中出现。 
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初始 状态： 参见 Invokevirtual 操作码 
最终 状态： 参见 Invokevlrtual 操作码 

invokevirtualobject _ quick (0 xd6 ) ——彳 nvoke virtual 调用对象方法的快速版本 
概要： Sun 公司的 JIT 编译器中内部使用的 invokevlrtual 操作码的优化版本。这一操作 
码不会在目前未加载和执行的 .cl ass 文件中出现。 

初始 状态： 参见 Invokevirtual 操作码 
最终状态： 参见彳 nvokev 彳 rtua 〗 操作码 
ior (0 x 80) integer 逻辑或 

板要： 从栈中弹出两个 integer , 计算它们的位或结果并作为32- bit 的整数压入栈中。 

初始 状态： int 
ini 

最终 状态： int 

irem (0 x 70) - integer 求余 

板要： 弹出两个单字的 integer , 并将 int -1除 int -2 的余数压入栈中。这一操作类似于 C 或 
Java &% 运算。 

初始 状态: int— 1 
int-2 

最终状态： int 

ireturn ( Oxac ) -从方法中返回 integer 

要： 从当前方法栈中弹出一个 integer 并压入到调用者环境中的方法栈。当前方法被终 
止，控制转移到调用者环境中。 

初始状态： int 
最终状态： ( n / a ) 
ishl (0 x 78) - integer 左移 

概要： 弹出两个 imeger , 将栈顶下的第二个元素左移栈顶元素低6位所示的次数，并将结 
果压入栈中。新空出的位 K 用0填充。这相当于乘2操作，但速度会更快。 

初始状态： int (移位） 
int (值) 

最终 状态： int 
ishr (0 x 7 a ) - integer 右移 

板要： 弹出两个 integer , 将栈顶下的第二个元素右移栈顶元素低6位所示的次数，并将结 
果压入栈中。 注意： 这是一个算数移位，符号位将会填充到新空出 的位* 中。 

初始 状态： int (移位） 
int (值) 

最终状态： int 

istore < varnum >(0 x 36)[ byte / short ] -存储 integer 到局部 变置中 

概要： 从堆栈中弹出一个 integer 并将其存储到第^3印11111>个局部变量中。在不使用宽 
( Wide ) 操作数前缀的情况下， < Va mum > 的值是一个0…255范围的 byte 。 否则为0…65536范围的 
short 0 

初始 状态： int 
最终状 态：一 
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istore _0(0 x 3 b ) —存储 integer 到局部变置 0 中 

概要：从栈顶弹出一个 integer 并存储到局部变量 0 中。 此功能等价于1 store 0，但它占用 
的字节数更少且速度更快。 

初始 状态 ： int 
最终状 态：- 



概要： 从栈顶弹出一个 integer 并存储到局部变量 1 中。此功能等价于 1 store 1 , 但它占用 
的字节数更少且速度更快。 

初始 状态： int 
最终状态：_ 

istore 一 2(0 x 3 d ) —— 存储 integer 到局 部变量 2 中 

梭要 :从栈顶弹出一个 integer 并存储到局部变量 2 中。此功能等价于 Istore 2, 但它占用 
的字节数更少且速度更快。 

初始 状态： integer 
最终状 态：一 

istoreJ 3( Ox 3 e ) — 存储 integer 到局 部变鱖3 中 

概要：从栈顶弹出一个 integer 并存储到局部变最 3 中。此功能等价于 Istore 3, 但它占用 
的字节数更少且速度更快。 

初始 状态： int 


最终状 态：一 

isub (0 x 64) - integer 减法 

板要： 弹出两个 integer , 计® 栈顶下的第二个元素和栈顶元素的差值并压入栈中。 

初始 状态 ： int 
int 

最终 状态 ： int 

iushr (0 x 7 c ) ——无符号 int 右移 

概要: 弹出两个 integer , 将栈顶下的第二个元素右移栈顶元素低6位所示的次数，并将结 
果压入栈中。 注意： 这是一个逻辑移位，符号位被忽略，0将会填充到新空出的位*中。 

初始 状态 ： int (移位） 
int (值） 

最终 状态 ： int 

ixor (0 x 82 )—integer 逻辑异或 

概要 •• 从栈中弹出两个 integer ， 计算它们的位异或结果并作为 32_ bit 的整数压入栈中。 
初始 状态 ： int 


最终 状态 ： int 

jsr _ w < label >(0 xc 9 [ int ]) —使用宽偏移董跳转到子过程 

橛 要： 将下一指令地址 ( PC +5, jsr ^ w 的指令长度为 5) 压入栈中，并无条件跳转到 
<labeJ >& 0 

初始状 态：一 
最终状态： address ( locn ) 
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jsr _ w < label >(0 xa8 [ short ]) ——跳转到子过程 

板要： 将下一指令地址 ( PC +3, jsr 的指令长度为 3) 压入栈中，并无条件跳转到 < label > 处^ 
初始状态：- 
最终状态： address ( locn ) 

I 2 f (0 x 89) —将 long 转换为 float 

概要： 从栈中弹出双字的 long ， 将其转换为一个单字的 float 并压入栈中。 

初始状态 ： long 
long 

最终 状态 ： float 

I2i (0 x88 ) —将 long 转换为 int 

梭要： 从栈中弹出双字的 long , 将其转换为一个单字的 integer 并压入栈中。 注意： 由于 
long 的原始符号位丢失，这可能会导致符号位的变化。 

初始 状态 ： long 
long 

最终 状态 ： int 

Iadd (0 x 61) - long 加法 

概要： 弹出两个 long , 计算其和并压入栈中。 

初始 状态： long -1 
long -1 
long -2 
long -2 

最终状态 ： long 
long 

Iaload (0 x 2 f ) —从 long 数组中加栽值 

概要 •• 从堆栈中弹出一个数组和 integer ,. 取出一维 long 数组中指定位 置的值 并压入栈顶。 
初始 状态 ： int (索引） 

address (数组引用） 

最终状态 ： long 
long 

Iand (0 x 7 f ) - long 逻辑与 

梭要： 从栈中弹出两个 long , 计算位与的结果，并将6 4 - bit 的 long 结果压入栈中。 

初始 状态： long -1 
long -1 
long -2 
long -2 

最终状态 ： long 
long 

Iastore (0 x 50) -存储值到 long 数组中 

梭要：将双字的 long 存储到 long 数组中。顶端所弹出的参数为定义所用位置的索引。第二 
/三个弹出的参数为需存储的 long 值，最后一个参数为数组本身。 

初始 状态 ： int (索引） 
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long 

long 

address (数组引用） 

最终状 态：一 
Icmp (0 x 94) -比较 long 

概要：将两个双字的 long 从操作数栈中弹出并比较。如果 long - 2大于 long - 1,将+1压入 
栈中，如果二者相等，将0压入栈中，否则的话将-1压入栈中。 

初始 状态： long-1 
long-1 
long-2 
long-2 

最终 状态 ： im 

Iconst _0(0 x 9) ——压入 long 常量 0 
概要： 将 64 位的 long 常量 0 压入操作数栈中。 

初始状态：一 
最终 状态： long ( O ) 
long ( O ) 

lconst _1 ( Oxa ) -压入 long 常最 1 

概要： 将64位的 long 常量1压人操作数栈中。 

初始状态：一 
最终 状态: long ( l ) 
long ( l ) 

Idc < constant >(0 x 12 [ short ]) -加载单字常最 

概要： 从常数池（参见词汇表）中加栽单字值并压入 栈中。 < constam > 可为 int 、 float 或字 
符串，它存储在常数池索引0...255的项中。 

初始状 态：- 
最终 状态： word 

Idc 2_ w < constant >(0 x 1 4 [ int ]) -加载双 字常置 

概要： 从常数池（参见词汇表）中加载双字值并压入栈中。 < constam > 可为 double 或 long , 
它存储在常数池索引 0... 65536的项中。 

初始状 态：- 
最终 状态： word 

ldc _ quick (0 xcb) —1 dc 操作码的快速版本 

板要： Sun 公司的 JIT 编译器中内部使用的 ldc 操作码的优化版本。这一操作码不会在目前 
未加载和执行的 .cl ass 文件中出现。 

初始 状态： 参见 Idc 操作码 
最终 状态： 参见 ldc 操作码 

Idc _ w < constant >(0 x 13 [ int ]) -使用宽索引加载单字常置 

概要： 从常数池（参见词汇表）中加栽单字值并压入栈中。 < COnS tant > 可为 int 、 float 或字 
符串，它存储在常数池索引0...65536的项中。 

初始状态：- 
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最终 状态 ： word 

ldc_w_quick(Oxcd) - 1 dc_w 操作码的快速版本 

梃要： Sim 公司的 JIT 编译器中内部使用的 ldc_w 操作码的优化版本。这一操作码不会在目 
前未加载和执行的 . cl ass 文件中出现。 

初始 状态： 参见 ldc_w 操作码 
最终 状态： 参见 ldc_w 操作码 
Idiv(0x6d) long 除法 

概要 •• 弹出两个双字的 long , 并将 long -1除 long -2的结果压入栈中。 

初始状态： long -1 
long -1 
long -2 
long -2 

最终状态 ： long 
long 

Iload<varnum>(0x16[byte/short]) - 从局部变置中加载 long 

板要： 从第 < varnum > ft < varnum + l > t 局部变 It 中加载双字的 long 并压入堆栈。在不使用 
宽 ( wide ) 操作数前缀的情况下， < varnum > 的值是一个0...255范围的 byte 。 否则为0…65536范围 
的 short 。 

初始状 态：一 
最终状态 ： long 
long 

Iload_0(0x1e) — 从局部变置 0 和 1 加载 long 

板要： 从局部变 ttO 和1中加载双字 long 并压入堆栈中。此功能等价于 1 load 0, 但它占用 
的字节数更少且速度更快。 

初始状 态：一 
最终状态 ： long 
long 

HoadJ(Oxlf) — 从局部变置 1 和 2 加载 long 

概要: 从局部变 ttl 和2中加载双字 long 并压入堆栈中。此功能等价于1 load 1 , 但它占用 
的字节数更少且速度更快。 

初始状 态：- 
最终状态 ： long 
long 

Iload_2(0x20) — 从局部变量 2 和 3 加载 long 

板要： 从局部变董2和3中加载双字 long 并压入堆栈中。此功能等价于 1 load 2,但它占用 
的字节数更少且速度更快。 

初始状 态：- 
最终状态 ： long 
long 

Iload_3(0x21) — 从局部变置 3 和 4 加载 long 

板要： 从局部变量 3 和4中加载双字 long 并压入堆栈中。此功能等价于1 load 3,但它占用 
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的字节数更少且速度更快。 

初始状 态：一 
最终 状态： long 
long 

Imul (0 x 69) - long 乘法 

板要： 弹出两个 long , 并将二者的乘积压入栈中。 
初始 状态： long-1 



long-2 

long-2 

最终 状态： long 
long 

Ineg (0 x 75) - long 求反 

板要： 弹出一个 i on g, 符号求反（乘以 -1) 后压入栈中。 

初始 状态： long 

最终状态： long 

lookupswtich < args>(Oxab [ args ]) -多路 M 转 

楗要：类似于 Java/C++ 中的 switch 语句，执行一个多路跳转。弹出栈顶的 integer 并同一 
组 value:label 对相比较。如果 integer 的值等于 value 的话，控制转 
移到 label 处。如果没有匹配的值，控制转移到缺省的 label 处。 
label 的实现采用的是相对偏移 ft , 把它的值加到当前的 PC 上， 

得到要执行指令的地址。图 B-1 所示的是使用 lookupswltch 语句 
的示例。 lookupswltch 语句的参数个数不定，因此字节码的存 
储上有一点复杂。在操作码 (Oxab) 后面，有 0 到 3 个填充字节， 

以使得 4 字节的缺省偏移*的开始位置是 4 字节的整数倍。接下来的 4 个字节定义的是 
vah^label 对的个数，每一对按照升序排列连续存储，其中包括 4 字节的 imegei •和 4 字节的偏移 
ft , 结构如表 B -1 所示。 

初始状态： int 

最终状 态：一 



图 B -1 lookupswitch 示例 


表 B -1 lookupswitch 字节码的结构 


操作码 (Oxab ) 和填充 


缺省偏移量 


条目的个数 


value 

offset 


offset N 
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Ior (0 x 80 ) —— long 逻辑或 

板要： 从栈中弹出两个 long , 计算它们的位或结果并作为6 4 - bit 的 long 压入栈中。 

初始状态： long -1 
long -1 
long -2 
long -2 

最终状态 ： long 
long 

Irem (0 x 70) - long 求余 

概要： 弹出两个单字的 integer , 并将 long -1除 long -2的余数压入栈中。这一操作类似于 C 
或 Java 的 X 运算。 

初始状态： long -1 
long -1 
long -2 
long -2 

最终状态 ： long 
long 

Ireturn ( Oxad ) -从方法中返回 long 

梭要： 从当前方法栈中弹出一个双字的 long 并压入到调用者环境中的方法栈。当前方法 
被终止，控制转移到调用者环境中。 

初始 状态 ： long 
long 

最终 状态： （ n / a ) 

Ishl (0 x 79 ) —— long 左移 

概要： 从找中弹出一个 integer 和 64- bit 的 long , 将 long 左移 integer 低6位所示的次数，并将 
结果压入栈中。新空出的位 S 用0填充。这相当于乘2操作，但速度会更快。 

初始状态 ： int (移位） 
long 
long 

最终 状态 ： long 
long 

Ishr (0 x 7 b ) - long 右移 

概要： 从找中弹出一个 integer 和 64- bit 的 long , 将 long 右移 integer 低6位所示的次数，并将 
结果压入栈中。新空出的位置用0填充。这相当于乘2操作，但速度会更快。 注意： 这是一个 
算术移位，符号位将会填充到新空出的位置中。 

初始 状态 ： int (移位） 
long 
long 

最终 状态 ： long 
long 
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Istore < varnum >(0 x 37)[ byte / short ] -存俺 long 到局部变置中 

概要：从堆找中弹出一个 long 并将其存储到第#08『!111111>和#«^311111111+1>个局部变量中。 
在不使用宽 ( wide ) 操作数前缀的情况下， < va r mim > 的值是一个0...255洁围的 byte 。 否则为 
0... 65536范围的 short 。 

初始 状态 ： long 
long 

最终状 态：- 

Istore _0(0 x 3 f ) —存储 long 到局部变置 0 和 1 中 

梭要：从栈顶弹出一个 long 并存储到局部变董 0 和 1 中。此功能等价于1 store 0,但它占 
用的字节数更少且速度更快。 

初始 状态 ： long 
long 

最终状 态：一 

lstore _1 (0 x 40) —存储 long 到局部变置 1 和 2 中 

概要；从栈顶弹出一个 long 并存储到局部变缓 1 和 2 中。此功能等价于1 store 1,但它占 
用的字节数更少且速度更快。 

初始 状态 ： int 
最终状 态：一 

Istore _2(0 x 41) —存储 long 到局部变量2和3中 

概要： 从栈顶弹出一个 long 并存储到局部变《：2和3中。此功能等价于1 store 2,但它占 
用的字节数更少且速度更快。 

初始 状态 ： long 
long 

最终状态：一 

Istore _3(0 x 42) —存储 long 到局部变置3和4中 

概要： 从栈顶弹出一个 long 并存储到局部变置3和4中。此功能等价于1 store 3,但它占 
用的字节数更少且速度更快。 

初始状态 ： long 
long 

最终状态：一 
Isub (0 x 65) - long 减法 

板要： 弹出两个双字的 long , 计算栈顶下的第二个元素和栈顶元素的差值并压入栈中。 
初始状态: long -1 
long -1 
long -2 
long -2 

最终状态 ： long 
long 

Iushr (0 x 7 d ) ——无符号 long 右移 

概要： 弹出一个 integer 和一个 64- bit 的 long , 将 long 右移 integer 低6位所示的次数，并将结 
果压入栈中。 注意： 这是一个逻辑移位，符号位被忽略，0将会填充到新空出的位置中。 
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初始 状态： int (移位） 
long 
long 

最终状态： long 
long 

Ixor(0x83) —— long 逻辑异或 

板要： 从栈中弹出两个 long, 计算它们的位异或结果并作为64- bit 的 long 压入栈中。 

初始 状态： long-1 
long-1 
long-2 
long-2 

最终状态： long 
long 

monitorenter(0x7d) - 获得对象锁 

板要： JVM monitor 系统能够协调并同步多线程对对象的访问。 monitorenter 从栈中弹出 
—个地址（对象引用）并从 JVM 请求一个独占的对象锁。如果没有其他线程锁定该对象，则 
发放该对象锁并继续执行。否則的话线程被阻塞并停止执行，直至其他线程通过 mon i torex it 
释放对象锁。 

初始 状态： address 

最终状 态：一 

monitorexit(0xc3 - 释放对象锁 

板要： 从栈中弹出一个地址（对象引用）并释放获得的（通过 monitorenter ) 对象锁，以 
使得其他线程能够获得对象锁。 

初始 状态： address 

最终状 态：一 

multianewarray<type><N>(0xc5[short][bytel) - 创建多维数组 

梭要： 为类型 S<type>WN 维数组分配空间并将数组引用压入栈中。字节码中存储的类型 
为2字节的常数池（参见词汇表）索引，维数 N 为0...255的一个字节。操作码的执行会从栈中 
弹出 N 个 integer, 代表数组每一维的大小。创建的数组实际上为一个（子）数组的数组。 

初始 状态： 维数 N 

维数 N -1 
• • • 

维数1 

最终状态： address 

multianewarray_quick(Oxdf) - multi anewarray 操作码的快速版本 

板要： Sun 公司的 JIT 编译器中内部使用的 multianewarray 操作码的优化版本。这一操作 
码不会在目前未加载和执行的 • cl ass 文件中出现。 

初始 状态： 参见 multi anewarray 操作码 

最终状态：参见 multi anewarray 操作码 

new<class>(Oxbb[short]) - 创建新对象 

板要:创建指定类的新对象。字节码中存储的类型为2字节的常数池（参见词汇表）索引。 
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初始状 态：- 

最终 状态 ： address (对象） 

new _ quick ( Oxdd ) —— new 操作码的快速版本 

梭要： Sun 公司的 JIT 编译器中内部使用的 new 操作码的优化版本。这一操作码不会在目前 
未加栽和执行的 . class 文件中出现。 

初始 状态： 参见 new 操作码 
最终 状态： 参见 new 操作码 

newarray < typename >( Oxbc [ type - byte ]) -创建一维数组 

概要：为类型 S < typename > 的一维数组分配空间并将数组引用压入栈中。字节码中存储 
的类型为2字节的常数池（参见词汇表）索引，新数组的大小从栈中弹出，数组的类型由操作 
码后的一个字节表示，其具体含义 如下： 


boolean 4 
char 5 
float 6 
double 7 


byte 8 
short 9 
int 10 
long 11 


初始 状态 ： int (大小） 

最终状态 ： address (数组） 
nop ( OxO ) —空操作 

橛要：空操作。空操作主要用干时序调整、调试和将来代码的占位符。 
初始状 态：一 
嵌终状 态：- 


pop (0 x 57) —从栈中弹出单字 

板要：弹出并丢弃掉栈顶的字（一个 integer 、 float 或地址）。 注意： 没有相对应的 push 指 
令，因为压栈操作是与类型相关联的 ，如： sipush 或 ldq 
初始 状态 ： word 


最终状态：一 


pop 2(0 x 58) —从栈中弹出双字 

板*:弹出并丢弃掉栈顶的双字（可以是两个单字量如 integer 、 float 或地址，或一个双字 
ft 如 long 求 double )。 注意： 没有相对应的 push 指令，因为压栈操作是与类型相关联的 ，如： 

初始 状态 ： word 


word 

最终状态：一 

putfield < fieldname >< type >(0 xb 5[ short ] [ short ]) -对象域賦值 

概要： 从栈中弹出一个地址（对象引用）和值，并将值存储到指定的对象域中。 
putfield 操作码带有两个参数，域标识符和域类型，它们在字节码中存储为2字节的常数池 
(参见词汇表）索引。不同千 Java 的是，域名必须是完全限定名，包括相关的类和包名。 

初始状 态：值 

address (对象） 

最终状态：一 
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putfiefd2_quick(0xd1) —用于 2 字节 p*itfi e 〗 d 操作码的快速版本 
概要： Sun 公司的 JIT 编译器中内部使用的 putfield 操作码的优化版本。 
在目前未加载和执行的 .cl ass 文件中出现。 

初始 状态： 参见 putfleld 操作码 
最终 状态： 参见 putfield 操作码 


这一操作码不会 


putfield 一 quick(Oxcf) —— putfield 操作码的快速版本. 

概要： Sun 公司的 JIT 编译器中内部使用的 putf i eld 操作码的优化版本。这一操作码不会 
在目前未加载和执行的 .class 文件中出现。 

初始状态：参见 putfield 操作码 
最终状态：参见 putfield 操作码 

putfield 一 quick 一 w(0xe4) —宽索引 putfleld 操作码的快速版本 

梭要： Sun 公司的 jit 编译器中内部使用的 pu tfi e id 操作码的优化版本。这一操作码不会 
在目前未加载和执行的 .class 文件中出现。 

初始 状态： 参见 putfleld 操作码 
最终状态：参见 putfleld 操作码 


putstatic < fieldname >< type >(0 xb 3[ short ] [ short ]) -类域賦值 

梭要： 从栈中弹出一个地址（对象引用）和值’并将值存储到指定的类域中。 putstatlc 
操作码带有两个参数，域标识符和域类型，它们在字节码中存储为2字节的常数池（参见词汇 
衣）索引。不同于 Java 的是，域名必须是完全限定名，包括相关的类和包名。 

初始状 态：值 

最终状 态：一 


putstatic 2 一 quick (0 xd 5 ) —— putstatic 操作码的替代快速版本 

嬈要： Sun 公司的 JIT 编译器中内部使用的 putstatfc 操作码的优化版本。这一操作码不 
会在目前未加载和执行的 .class 文件中出现 c 
初始 状态： 参见 putstatlc 操作码 
最终状态：参见 putstatlc 操作码 
putstatic_quick(0xd3) —— putstatic 操作码的快速版本 

概要: Sun 公司的 JIT 编译器中内部使用的 putstatic 操作码的优化版本。这一操作码不 
会在目前未加载和执行的 • cl ass 文件中出现。 

初始 状态： 参见 putstatic 操作码 
最终 状态： 参见 putstatic 操作码 
ret < vamum >(0 xa 9 [ byte / short ]) -从子过程返回 

概要： 在通过 Jsr 或 jsr_w 跳转到子过程后，返回到 <varnum> 局部变最:中存储的地址。在 
不使用宽 ( wide ) 操作数前缀的情况下， <varnum> 的值是一个0...255范围的 byte。 否则为 
0... 65536范围的双字节量。 



最终状态：- 

return ( Oxbl ) ——不带返回结果从方法返回 
板要：结束当前方法并将控制转移回调用环境。 
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初始状 态：一 

最终 状态： （ n / a ) 

saload(0x56) - 从 short 数组中加载值 

板要： 从堆栈中弹出一个数组和 integer ， 取出一维 short 数组中指定位置的 16- bit 的 short 值， 
符号扩展成一个 integer 并压入栈顶。 

初始 状态： int ( 索引） 

address (数组引用） 

最终 状态： int 

sastore(0x56) - 存储值到 short 数组中 

概要： 将 16- bit 的 short 存储到 short 数组中。顶端所弹出的参数为定义所用位 K 的索引。第 
二个弹出的参数为需存储的 short 值，第三个（最后一个）参数为数组本身。第二个参数由 im 
截断为 short 并存储在数组中。 

初始 状态 ： im ( 索引） 
int ( short ) 
address (数组引用） 

最终状 态：一 

sipush<constant>(0x11 [short]) - 将 [integer】short 压入栈中 

概要 •• 参数 short 的值 (-32768 … 32767) 符号扩展为一个 integer 并压人栈中。 

初始状 态：一 

最终 状态： int 

swap(0x5f) — 交换栈顶的两个元索 

概要： 交换栈顶的两个单字的元素。遗 憾的是 不存在 swap2 指令。 

初始 状态： word -1 
word -2 

最终 状态： word -2 
word -1 

tableswtich<args>(Oxaa [args]) - 多路跋转 

概要： 类似于 Java / C + + 中的 switch 语句，执行一个多路跳转。弹出栈顶的 integer 并同一组 
value : label 对相比较。如果 integer 的值等于 value 的话，控制转移到 label 处。如果没有匹配的值， 
控制转移到缺省的 label 处。 label 的实现采用的是相对偏移量，把它的值加到当前的 PC 上，得 
到要执行指令的地址。这一指令的执行比 lookupswltch 效率更髙，但要求值必须是顺序且连 
续的。 

tableswitch 语句的表中包括最小和锒大值。如果从栈中弹出的 integer 小于最小值或大于最 
大值，则控制转移到缺省的丨 abel 处，否则，控制直接转移（不需要比较）到表中弹出的值减 
掉最小值的 label 处。 

图 B -2 所示的是使用的 tabl eswi tch 语句的示例。 

tableswitch 语句的参数个数不定，因此字节码的存储上有一点复杂。在操作码 ( Oxab ) 
后面，有0到3个填充字节，以使得4字节的缺省偏移量的开始位置是4字节的整数倍。接下来 
的8个字节表示表中的最小值和最大值，接下来的偏移量顺序存储，每个包括4个字节。结构 
如表 B -2 所示。 

初始 状态 ： int 
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最终状态 ：- 


tableswitch 1 3 
One 
Two 
Three 

default:Elsewhere 


图 B-2 tableswitch 示例 
表 B-2 tableswitch 字节码的结构 



wide (0 xc 4) —指定下一个搡作码为宽索引 

梭要：这是一个操作码前缀而非操作码。它表示下一操作的参数有可能比正常情况要大 
一些 。如： 在1 load 中使用大于255的局部变量。 jasmin 汇编器在需要时会自动生成这一前缀。 
初始状态：一 
最终状态 ：- 
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lastore 

fastore 

dastore 

aastore 



dup_xl 

dup_x2 



dload.l 

dload.2 

dload.3 

aload.0 

aload.l 

aload.2 

a1oad_3 


46474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091 


l oxo issISEIl oxe sl OXIl iilililE oxlc ll OXIf EEliliiE 

操 

准 

标丨 

0123456789101112131415161718192021222324252627282930313233343536373839404142434445 
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tab 


eswitch 



Invokevlrtual 



ikelnterface 
xxxunusedxxx 


newarray 

anewarray 


athrow 

checkcast 

instanceof 

monltorenter 

monitorexit 

wide 

multianewarray 
ifnull 
ifnonnull 
goto-w 

jSPJW 


149 150151152 153154 155 156157 158 159 160 161 162163 164165 166 167 168 169170 171172173174175 176 177 178179 180181 182183 184 185 186 187 188189190191192193194195196197198199200201 


dup2 rlllil = Hllllli;::lls^ 

s!sss;s 100§1021031()4 105 106 107108 109110 111112 113 114115116 117118119 120s122123124125 126 127128 129 130s132133134135136137138139140s 142 143 144 145146147148 
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C-2 保留的操作代码 


JVM 标准还保留了以下的操作 代码: 

202 Oxca breakpoint 

254 Oxfe impdepl 

255 Oxff i mpdep2 


操作代码 202 ( breakpoint ) 用于调试，而操作代码 254 和 255 則保留用于 JVM 本身的内部 

用途。它们永远不应该出现在一个存储的类文件中。事实上，带有这些操作代码的类文件应 
该不能通过验证。 ' 


C.3 “快速”的伪操作代码 

在1995年， Sun 微系统公司的研究人员提出采用内部“快速”操作代码作为提髙 j ava 编译 
器速度和效率的方法。通常，当访问常置池中的一个条目时，该条目必须被解析以确认其可 
得到和类型兼容。如果一条语句必须执行若干次，这个解析过程就会减慢计算机的速度。作 
为其即时 ( Just - In - Time , JIT ) 编译器， Sun 提出了一组操作代码，这些操作代码假设条目已 
经敁解析。当一个正常的操作代码被成功地执行时，其在内部可用一个“快速”伪操作代码 
替换，以跳过解析步骤，加快后续工作的执行速度。 

这些伪操作代码永远不应出现在一个长期存储的类文件中^相反， JVM 本身可将操作代 
码重写在一个正在执行的类中。如果做得正确，这个变化对于 Java 程序员甚至编译器编写者 
来说就完全是不可见的。所提出的优化伪操作代码 包括： 


203 

Oxcb 

Idc.quick 

205 

Oxcd 

ldc.w.qulck 

206 

Oxcc 

getfield.qulck 

207 

Oxcf 

putfield.quick 

208 

OxdO 

getfie1d2.quick 

209 

Oxdl 

putfield2 quick 


210 0xd2 getstatlc.quick 

211 0xd3 putstatic.quick 

212 0xd4 getstat1c2.qu1ck 

213 0xd5 putstatic2_quick 

214 0xd6 i nvokevl rtual .qul ck 

215 0xd7 i nvokcnonvi rtual _qu1 ck 

216 0xd8 invokesuper.quick 

217 0xd9 1 nvokestatl C-qui ck 

218 Oxda i nvokei nterf ace_qu1 ck 

219 Oxdb invokevi rtual object-quick 

221 Oxdd new_quick 

222 Oxde anewarray .quick 

223 Oxdf mul ti anewarray.qul ck 

224 OxcO chcckcast_quick 

225 Oxel instanceof-quick 

226 0xe2 i nvokevi rtual _qui ck_w 

227 0xe3 getfield_quick_w 

228 0xe4 putfield_quick_w 


当然，不同的实现者也完全可采用不同的优化方法或一组不同的快速操作代码。 
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C .4 未使用的操作代码 

操作代码186由于历史原因未被使用，其先前的用法在目前的 JVM 版本中已不再有效。操 
作代码204、220及 229-253 在目前的 JVM 规范中未予分配，但在较后的版本中可能得到分配和 
使用。 
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D .1 概述和基本原理 

在第10章我们曾简要地提到过， JVM 的类文件被存储成一组嵌套的表。这实际上有 点用, 
词不当，因为在类被存储或传送时都使用相同的格式，所以在网络上接收到的类都是相同的 
格式，成为 “.file.”。 每个 “file” 包含了类所需要的信息，包括所有方法的字节码、类内部 
的域和数据，以及与类系统的其余部分进行交互作用的属性，包括名字和继承的细节。 

在类文件中的所有数据都存储成8位字节或者16位、32位、64位这样多个字节的组。这在 
标准文档中分別以 ul、u2、 114、 u8 来引用，但是，如果将它们仅仅看作是字节、短整数、整 
数及长整数或许会更容易一些。要防止采用不同存储惯例的机器之间出现混乱（比如8088及 
其字节交换），字节被定义为按“网络顺序”（也称为“大端字节序”或者“最髙有效字节 
(MSB) 顺序”）到来，就是最高有效字节首先到来。例如，任何 JVM 类的前4个字节必须是所 
谓的魔幻数 OxCAFEBABE (显然是一个整数）。这个数被存储成4字节序列的顺 序是： OxCA、 
OxFE、OxBA、OxBE. 

类文件的顶级表包含一些（固定大小的）内务管理信息，以及5个大小变化的低级表。在 
不同组件之间没有填补或对齐，这使得从类文件中取出特定部分有些困难。 

类文件的详细顶级格式（表 D_l) 如下 所示： 


表 D -1 类文件格式的详细说明 



縻幻数 

次版本 

主版本 


常 M 池数董 

常&池 


访问标志 

该类 

超类 


数癸 


定义的 (ft 是 OxCAFEBABE 
定义与哪个次版本的 JVM 类文件相容 
定义 与 哪个主版本的 JVM 类文件相容 


在接下宋的表中 的锒大条目数 
类使用的常5池 


有效访问类5! (public、static、interface , 等等) 
该类的类喂的标志符 
泫类的超类类犁的标忐符 


在接下来的表中的条 H 数 
该类实現的接口 


在接下来的表中的条目数 
作为该类组成部分而声明的域 


属性数 5: 
厲性 


在接下来的表中的条目数 
该类的其他*性 


“魔幻数”已经描述过了，其作用是使在系统中快速辨识类文件更容易，此外并无实际意 
图。主版本和次版本号有助于跟踪兼容性。例如，一个非常老的类文件（或者用非常老的 
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Java 版本编译的类文件）可能使用已不存在或语义已改变的操作代码。目前的 Java 版本（就是 
2006年版）使用了次版本号0和主版本号46 (0 x 2 e ), 对应于新的 Java 5.0 版。 

这个类及其超类的域引用常量池中的条目（细节请见下一部分），并定义了当前类的名字 
以及直接的超类。最后，访问标志域定义了当前类的与访问相关的性质，例如，如果这个类 
被定义成 abstract , 这就阻止了其他类将其用作为 new 指令的参数。这些性质作为独立的标志 
存储在一个双字的位向 置中， 如下 所示： 

含义 ^_ 解释 _ 

0 x 0001 类可被访问 

0 x 0010 • 类不能 有子类 

0 x 0020 新的调用语义 

0 X -200 文件实际 I :是接口 

0 x 0400 类+能被实例化 


public 



super 

interface 

abstract 


这样，如果访问标志域是 0 x 0601, 就定义了 “ public ”、“ abstract ”、“ interface ”。 

D .2 子表结构 

D .2.1 常置池 

常量池被构造成为一序列的独立条目，表示程序所使用的常致。例如，一个表示整数值 
1010的常 ft 将被存储在5个连续的字节中。 ft 后4个字节就是1010的二进制表示（作为整数）， 
而第一个字节是一个标志值，将这个条目定义为一个整数（因此要5个字节）。根据标志类型 
的不同，条目的大小和内部格式如下表 变化： 


类窀 

值 

UTF 8 串 

1 

整数 

3 

浮点败 

4 

K ： 螫数 

5 

双精度数 

6 

类 

7 

串 

8 

域引用 

9 

方法引用 

10 

接口方法引用 

11 

名字和类型 

12 


整数、长整数、浮点数以及双精度数的结构是不言自明的。例如，一个常量池的整数入 
口包含5个字节，初始字节为3 (将该条目定义为整数），4个字节就是整数值本身。 UTF 8 串被 
存储成一个无符号的长度值 （2 个字节长度，允许65536个字符的串）和一个包含了串中字符 
值的变长度的字节数组。在 Java 类文件中的所有文字串，包括串常最、类名字、方法和域的 
名字等等，都在内部存储成 UTF 8 串常量。 

其他类型的内部域引用了常 S 池中其他条目的索引。例如，一个域引用包含5个字节。第 
一个字节是定义了一个域的标志值（值为9)。第二个和第三个字节保存了常畺池中另一个条 
目的索引，定义了该域属于哪个类。第四个和第五个字节保存了一个“名字和类型”条目的 
索引，定义了名字和域。这个名字和类型条目有一个适当的标志（值为12)，然后就是定义了 
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名字/类型的两个 UTF 8 串的索引。 

关于常量池有两个重要的警告。由于历史原因，常量池条目号0从未被使用过，初始元素 
的索引是1。由于这个原因，与 Java 中多数其他数组类型元素（以及其他类文件条目）不同， 
如果有 k 个常量池条目，则最高条目是 k 而不是 k -1。 还因为历史原因，类型为长整数或双精度 
数的常量池条目被当作两个条目看待。如果常量池条目6是一个长整数，则下一个池条目的索 
引就应该是8。在这种情况下，索引7将是无用和非法的。 

D.2.2 域表 

类的每个域在内部定义为一个具有如下域的表条目： 


大小 标志符 注释 


短整数 

访问标志 

该域的访问性质 

短整数 

名字 

在常量池中的名字索引 

短整数 

描述符 

串类型的索引 

短整数 

属性数 

域域性的数 ft 

变 tt 

属性 

域厲 性数组 


名字和类型域只不过分别是常量池中名字和类型描述符串的索引。访问标志域是标志的 
位向 tt ， 像以前一样（下面的表给出了解 释）， 为域定义了有效访问厲性。最后，厲性表定义 
了域的属性，就像类《性表定义了类作为整体的 厲性。 


含义 

位值 

解释 

Public 

0 x 001 

域亏被访问 

Private 

0 x 0002 

域只能被定义类所访问 

Protected 

0 x 0004 

域可被类和子类所访问 

Static 

0x0008 

类域.非实例域 

Final 

0 x 0010 

域不能被改变 

volatile 

0 x 0040 

域不能被缓存 

transient 

0 x 0080 

域不能被对象管理器写/读 


D.2.3 方法表 

类中定义的每个方法都在内部描述为一个表条目，其格式几乎与前面描述的域的条目相 
同。唯一的差异就是对于的不同访问标志用了特定的值来表示，如下表 所示： 


含义 

位值 

解释 

public 

0 x 0001 

域可被访问 

private 

0 x 0002 

域只能被定义类所访问 

protected 

0 x 0004 

域可被类和子类所访问 

Static 

0 x 0008 

类域，非实例域 

Final 

0 x 0010 

域不能被改变 

synchronized 

0 x 0020 

调用是时钟同步的 

native 

0 x 0100 

用本地硬件语言实現 

abstract 

0 x 0400 

没有已定义的实現 

S trick 

0 x 0800 

严格的浮点语义 


D.2.4 厲性 

类文件的几乎所有部分，包括顶级表本身，都包含一个可能的属性 （ attribute ) 子表。这 
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个子表包含了由编译器所生成的“属性”，用以描述或支持计算。每个编译器都允许定义特定 
的属性，而 JVM 的实现还要能忽略其不认识的属性，所以这个附录无法提供一个可能属性的 
完全列表。另一方面，某些属性必须存在，如果 JVM 所要求的某个属性不存在，则 JVM 就不 
能正确运行。 

每个属性被存储为以下格式 的表： 



标志符 



短整数 


厲性名 


填性的名字 


整数 滇性长度 以字节数表示的域性长度 

变量 信息 属性的内容 


可能最显.然（并且敢 重要〉 的属性就是 Code 属性，它作为方法的一个 属性， 包含了特定 
方法的字节码。 Exceptions 属性定义了特定方法可能给出的异常类型。为支持调试器， 
Scmrcefile 属性存 储了创建该类文件的源文件名， LineNumbeiTable 存储了在字节码中的哪些字 
节与源代码中的哪些行相对应。类似地， LocalVariableTableW 性定义了（在源文件中的）哪 
个变置与 JVM 中的哪个局部变董相对应。用 -g 标志（在 *NIX 系统上）进行编译（或汇编），就 
通常会导致这些属性被放*到类文件 # 如果没有这个 - g , 这些属性就经常被忽略以节省空间 
和时间。 





附录 E ASCII 表 


注意： ASCII 0 x 2.0 (十进制 32) 是一个空格 (-") 字符. 

E .2 历史和概述 

ASCII , 即美国标准信患交换码 （American Standard Code for Information Interchange ) 
几十年来一直是以二进制格式对字符数据进行编码的最常用标准（它在1963年形成，在1968 
年国际化）。其他曾经常用的格式如 EBCDIC 和 Bauot 在很大程度上已经成为历史。初始的 
ASCII 字符集定义了一个7位的标准，用于对128个不同的字符进行编码，包括（美国英语中) 
全部大写和小写字母的集合，以及很多符号和标点符号。此外，在 ASCII 表中前32个项定义了 
大多数的不可打印的控制字符 (control characters ), 如退格 （ backspace , 0 x 08)、[水平】制表 
符 （horizontal tab , 0 x 09)、[垂直】制表符 （vertical tab , 0 x 10)，甚至一个有声的“铃声 
( bell )" (现在通常是一次响铃 beep , 0 x 07)。遗憾的是， ASCII 对非英语的语言支持得不好, 
甚至对很多常见的有用符号如一、< 以及英镑符号 ( £ ) 也不支持。 

由于几乎所有的计算机都是存储8位字节，所以字节 0 x 80...0 xFF 这些没有被解释成标准字 
符的字节值就常常用于对 ASCII 表进行机器无关的专有扩展。例如，字母6用于德文中而不用 
于英文中。微软已经定义了一个扩展的 ASCII 表（此外还有由多种基于 Windows 程序所使用的 
若干个不同集合），该表用项 0 x 94 来表示这个值，作为一个相当完整的德文专用字符集的组成 
部分。这个表还将项 0 xE 2 定义成大写的 r , 但奇怪的是却没有为小写的@义一个项。我猜测， 
对于字符集的设计者来说，说德语的市场要比说希腊语的市场更重要。对比起来，苹果对于 
扩展的字符没有定义意思（至少对千其在 0 S X 环境下的“终端”环 境〉。 

问题的核 心是： 只有256种不同存储模式的单个字节不能存储足够多的不同字符。 Java 的 
解决方案是采用一个更大的字符集 （ Unicode ) 并将它们存储成2字节的量。 


char 


charrr 

Il060e16 le 262e363e464es6se666e76 7e 


char 


Qur 


Hex 


表 Hex 


77GOW - gowde 


07of17)f272f373f474f575f676f77 


叫 


05od lsld 25 2d 353d454d55sd 6s6d 75 7d 


04OC141C242C343C444C545C646C747C 


O3obl3lb232b333b434b53sb636b737b 


3r 


020 el 2 u 222 a323a424a525a626a727« 


dc s - 


091119212931394149S15961697179 


die 


OOO8IOI82O283038404850S860687O78 


E 
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80 x 86 family (80 x 86 系列） Intel 制造的一个系列芯片,从 Intel 4004开始，并历经8008、 
8088、80086、 80286. 80386、80486,以及各种奔腾芯片。这些芯片构成了 IBM-PC 的基 
础，其后继就是当今最常用的芯片体系结构。 

absolute address (绝对地址）在基于 8086 的计算机中，通过对段 :偏移 存储地址进行组合而 
获得的20位地址。 

abstract (抽象）一个不包含直接的实例而只有子类的类。或者是一个必须在子类中实现的 
未实现的方法。 

accumulator (累加器）一个为进行髙速算术运算，特别是加和乘而指定的单个寄存器。在 
80 x 86 计算机中就是 [ E 】 AX 寄存器。 

actual parameter (实际参数）在对函数或方法进行调用时，用于替代形式参数的实际值。 
address (地址）在存储器中的一个位置，或者说是用于指定存储器中某位置的数。 
addressing mode (寻址模式）解释位模式的方式，用来为语句定义实际的操作数。例如， 
位模式 0 x 0001 可指定实际常数1、第1个寄存器、存储器位 置1 的内容， 等等。 参见各个模 
式: immediate mode (立即模式）、 register mode (寄存器模式）、 direct mode (直接模式）、 
indirect mode (间接模式）、 index mode (变址模式）。 
algorithm (筧法）一个按步进行的、意义明确的过程。用于达到期®的目标或执行一个计 
算。 

ALU 典型计算机体系结构中的一个部件，在其中要执行算术和逻辑 操作。 是 CPU 的一部分。 
American Standard Code for Information Interchange (美国信息交换标准码）参见 
ASCII 0 

AND (与 （ AND )) —个布尔函数，当且仅当所有参数都是真时返回真，否则就返回假 。一 
个与门是一个硬件电路，它对输入电信号实现了与函数。 
applet (应用程序 ( applet )) 一个小的、可移植的程序，典型地是作为 Web 页的一部分。 
Arithmetic and Logical Unit (算术和逻辑单元）见 ALU 。 

arithmetic shift (算术移位）一个移位操作，其中最左端（最右端）位被复制以填充空出的 
位置。 ' 

array (数组）一个派生的类型。是由一个整数索引的一组相同类型的子元素。 

ASCII ( ASCII ) 用二进制格式表示字符数据的一种标准方式。 ASCII 集为字母、数字以及一 
些常用标点符号定义了7位的模式。 • _ 

assembler (汇编器）一个将用汇编语言写成的原文件转换成可执行文件的程序。 
assembly language (汇编语言）一种低级语言，其中每条人可读的语句精确地对应一条机 
器指令。不同的计算机类型有不同的汇编语言。 
attributes (属性） JVM 类文件格式的一种数据结构，用于存储多方面的信息。 
backward compatibility (向后兼容）计算机或者系统复制以前机型的操作的能力。例如， 
奔腾对于8088是向后兼容的，所以对于为最初 IBM - PC 写的程序它也能运行。 
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base Jil '. 用数制中数字的位置表示的数值。例如， 二 进制的基数是 2 , 十 进制 

集基数是 16 。 2 •(基 极）在晶体管中的-个电连接，用于控制 

BAT ( BAT ) 将存储管理器内部的逻辑地址转换到固定物理存储块的方法。 

BCD 6^^i、《f 80X86 系列的数字处理器中所采用的一种方法。在这种方法中，-个数 
的母 I 十进制数字被写成相应的 4 位二进制模式。例如，数 4096 写成 BCD 数就是 

0100 0000 1001 01 H)。 拟^疋 

;种存储 格式， 其中最髙有效位存储成字的第-个和最髙序的位。 
依照大端子节序格式，数32770将被存储成二进制】0000010。 

binary (Binary ( 二 进制/ 二元 ）） L — 种计数制，其中所有数字都是！或者 0 , 并且连续数字 

=值是2倍的关系。数 M 写成 二进制 賊是 i Un 。 2.只接受两个雛数的数学操作符， 

Binary Coded Decimal ( 二进制编码的十进制数）见 BCD 。 

bit (位）-个 二 进制数字，是计算机内信息的基本单位。-个位可有两种 取值. 0或者1 

b，lW， vJf^ —种布尔_。紐字节滅⑽錢鞠中，柳跡是侧对每个; i 独 
立地进行的。 

block address translation ( 模块地址转换）见 BAT. 

boolean 依乔治•布尔命名的-种逻轿系统，其中的操作定义成 二 进制 * 

上的函数并按此执行。 

branch (转移）一种机器指令，这种指令改变程序计数器 （PC) 的值因而导致计算机在一 
个不间的存储位 K 开始执行。一个等价的术语是 goto# 
branch prediction (分支） 麵 > -种优化技术， S 种技术通过预测条件转移析令是 

否发生转移来加速计算机的运行 速度。 

bus (总线）典型机器体系结构的一个组件，承担 CPU、 存储器以及外设之间的连接任务 
busy-waiting (总线等待）通过检测車件是否在循环内部已经发生来等待期望的事件。中 
断比较。 

byte (字节）8个位的集合。用作为一个存储单位，以表示存储器大小或者寄存器容址。 
bytecode (字节码） JVM 的机器语言。 

cache memory (高速缓冲存储器）一块髙速存储器’用于存储经常访问的项以提高存储器 
的总体性能。 

Central Processing Unit ( 中央处理单元）见 CPU 。 

CF 进位标志，当最近的操作生成一个向寄存器外的进位时（比如两个数相加得到的和过大 
时），就将其置位。 

CISC —种计算机设计观点，即使用很多复杂的专用指令。与 RISC 相对。 
class (类）一组域和方法，定义了面向对象编程环境中的对象类型。 
class files (类文件） JVM 采用的一种格式，用于将类（包括记录和 接口） 存储到长期存储 
器或通过网络发送。 

class method (类方法）由面向对象系统所定义的方法，是作为类的特性而不是该类的任何 
实例的特性。 

class variable (类变景）由面向对象系统所定义的变量，是作为类的特性而不是该类的任 
何实例的特性。 
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clock signal (时钟信号）计算机用来对亊件进行同步和度量时间推移的电信号。 

CLR 微软的 . NET 框架的虚拟机。 

code (代 码） 可执行的机器指令，与数据相对。 

collector (集电极）标准晶体管的一部分，除非基极电流关闭，将会有从发射极到集电极的 
电流。 

comment (注释）编程语言中的语句，虽然被计算机所忽略，但却可能包含了可读的有用信 
息。在 jasmin 中，注释开始于分号（;），直至行尾。 

Common Language Runtime (通用语言运行时）见 CLR 。 
compiler (编译器）一种程序，用于将用高级语言写的源文件转换成可执行文件。 
complete/writeback (完成/写回）流水线体系结构中的一个典型阶段，在这个阶段将操作的 
结果存储于目标位 S 。 

Complex Instruction Set Computing (复杂指令集 i 十算）见 CISC 。 
conditional branch (条件转移）一种转移（如 ifle ), 根据当前机器状态决定是否转移。 
constant pool (常量池）特定 JVM 类使用的一组常景，存储在类文件中。 
control characters (控制字符）值低于 0 x 20 的 ASCII 字符，表示非打印字符，如回车或响 
铃。 

Control Unit (控制单元） CPU 的组成部分，其功能是将数据移入和移出 CPU 和确定执行哪 
条指令。 

CPU 计算机的心脏，在其中发生计算，程序被 执行。 通常由控制单元和 ALU 组成。 
data memory (数据存储器）用于存储程序数据（如变最）而不是程序代码的存储器。 
decimal (十进制）基数为 10 。写数字的通常方式。 

derived type (派生类型）通过将基本类型相结合而建立起来的数据表示类型。例如，一个 
分数类型可由分子和分母两个整数派生而成。 
destination (目标）数据的去处。例如，在指令 ist ore _3 中，目标是局部变妖#3。 
destination index (目标变址）在 80x86 系列中的一个寄存器，用干控制串原始操作的目的 
地。 

destination operand (目标操作数）定义了指令目标的操作数，在奔腾指令集中，如在 
MOVAX , BX 中，目标操作数通常为第一个操作数。 
device (设备）外设的另一个名字。 

device driver (设备驱动器）一个程序（或者操作系统的组成部分，用于控制设备）。 
diode (二极管）一•种电气部件，只能允许电从一个方向通过。是晶体管结构的组成部分。 
Direct Memory Access (直接存储器访问）计算机拥有的一种能力，即让数据在主存储器 
与外设（如图形卡）之间移动而无需通过 CPU 。 

direct mode (直接模式）一种寻址模式，其中的位模式被解释为保存了所需操作数的存储 
位 S 。 在直接模式中，位模式 0 x 0001 被解释为存储位 S 1。 
directive (汇编指令）汇编语言中的语句，在 jasmin 中，以句号 （.） 开头，这种语句不转换 
成机器指令但给汇编器指示。 . limit 就是汇编指令的例子。 
dirspatch (分派）流水线体系结构的一个典型状态，此阶段要做 的是： 计算机分析指令以确 
定是什么类型的指令，从适当的位置获得源参数，并为实际执行准备指令。 
dopants (掺杂物）有意加入到半导体（如硅）中的杂质，以影响其电特性。引入这些杂质 
就能构造出二极管和晶体管，这些都是像计算机这种电子设备的关键部件。 
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DRAM ( DRAM ) -种 RAM , 需要不断地刷新以保持数据。比 SRAM 慢但便宜。与所有的 
RAM —样，如果电源关闭，则存储器丢失其数据。 
dst 目标 (destination) 的缩写。 

Dynamic RAM (动态 RAM ) 见 DRAM 。 

EEPROM —种混合存储器，结合了 RAM 的现场可编程性和 ROM 的数据持久性。 
Electronically Erasable Programmable ROM (电可擦除可编程 ROM ) 见 EEPROM 。 
embedded system (嵌入式系统）一种计算机系统，其中的计算机是更大环境的^成部分 
而不是独立可使用的工具。一个例子是运行 DVD 播放器的计算机。 
emitter (发 射极） 标准晶体管的组成部分，除非基极电流关闭，将会有从发射极到集电极的 
电流。 

EPROM —种 PROM ， 一般可通过暴露于髙能紫外光中几秒钟来擦除其内容。这些存储器是 
可重编程的，但不是现场可重编程^ 

Erasable Programmable ROM (可擦除可编程 ROM ) 见 EPROM 。 

execute (执行）】•运行一个程序或机器指令。 2 •在流水线体系结构中的一个典型状态，在 
此阶段计算机运行一条以前取出（并分派）的指令。 
exponent (指数）在 IEEE 浮点表示中的一个域，用于控制2的幕，该幂要乘以尾数。 
extended AX register (扩展 AX 寄存器）在80386或 80 x 86 系列较后来的芯片（包括奔腾） 
上的32位累加器。 

fetch (取指） 1 . 装入一条机器指令以准备执行 e 2 . 流水线体系结构的一个典型状态，在此 
阶段计算机从主存储器装入一条指令。 

fetch-execure cycle (取指-执行周期）是指这样的 过程： 计算机通过取指得到要执行的指 
令，执行该指令，然后再取序列中的下一条指令，直到程序结束。 

Fibonacci sequence (斐波那契序列）序列 1 ， 1 , 2 , 3 … •， 其中每一项是前面紧邻两项之和。 
fields (域）在记录或类中命名的数据存 储位* # 

flags (标志）用于存储数据的二进制变设。参见 flag register (标志寄存器）。 
flags register (标志寄存器）在 CPU 中的一个特殊寄存器，保存了一组与当前计算状态相关 
的二进制标志。例如，如果在算术计算中机器发生溢出，一个标志（一般称为“溢出标 
志”即 OF ) 将被 K 为1。一个后来的条件转移指令可检査这个标志。 

Flash (闪存存储器）一种混合存储器，将 RAM 的现场可编程性与 ROM 的数据持久性相结合。 
通常用于笔型 U 盘和数字相机中。 

floating point (浮点）1.计算机中存储的任何非整数值。2.—种特定的格式，用于存储二进 
制科学表示法的非整数值。值被存储成尾数与2的指数幂的乘积。 

Foating Point Unit (浮点单元）见 FPU 。 

FPU ( FPU ) 配属于 CPU 的专用硬件，用以处理浮点（不是整数）计算。现在有点罕见了， 
因为多数 CPU 能在自身处理浮点操作。 

foraml parameter (形式参数）用在函数或方法定义中的变量，用于作为以后实际参数的占 
位符。 

garbage collection (垃圾收集）回收不再使用的存储位置。在 JVM 中是自动进行的。 
gates (门）实现了布尔函数的电路。 
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goto 参见 branch (转移）。 

Harvard architecture (哈佛体系 结构〉 一种 非冯. 诺依曼体系结构，其中的代码存储（用 
于程序）与数据存储（用于变量）是分开的。 

hexadecimal (十六进制）基为16。一种数制，其中所有数字都是 0-9 或字母 A - F ， 并且连续 
的数字之间是16倍的关系。十六进制数33可写成0 x 31。 
high (髙）寄存器或数据值的高位部分。特别是，在8088上的通用寄存器的最髙有效字节。 
2. 见 high-level (髙级)。 

high-level (高级）指 Java 、 C ++、或 Pascal 这样的高级语言，其中的一条语句可能对应于若 
干条机器语言指令。 

hybrid memory (混合存储器）一种存储器，其设计将 RAM 的现场可重写性和 ROM 的数据 
持久性结合起来。例如，见 EEPROM 或 Flash 。 

immediate mode (立即模式）一种寻址模式，其中的位模式被解释为常数操作数。在立即 
模式中，位模式0 x00 〗就是常数1。 

implement (实现）接口的实现就是遵循接口而不是接口的一个 实例。 
index mode (变址模式）一种寻址模式，其中一个位模式被解释为针对一个存储地址的偏 
移，该存储地址存在一个寄存器中。 

indirect address register (间接寻址寄 存器〉 一个用于间接或变址模式的寄存器，如奔腾的 
BX 或 Atmel 的 Y 寄存器。 

indirect mode (间接模式）一种寻址模式，其中的一个位模式被解释为保存了指向实际操作 
数指针的存储位8。在间接携式中，位樓式 0 x0001 将被解释为存储在存储位置1的值。 
infix (中缀）一种写表达式的方法，其中的二元操作符位于其参数之间，如3 + 4。请比较后 
缀和前缀。 

initialize (初始化）在使用前设*一个特定的初始值，或者调用一个函数来执行这个任务。 
instance method (实例方法）一个方法，由面向对象系统作为一个性质定义，而不是由其 
控制类所定义。 

instance variable (实例变量）一个变{*，由面向对象系统作为一个性质定义，而不是由其 
控制类所定义。 

instruction (指令）一般来说是对计算机的一个命令。在机器代码中，就是表示单个操作的 
位 模式。 在汇编语言中，就是一种能直接转换成机器指令的语句。 
instruction pointer (指令指针）见 IP 。. 

instruction queue (指令队列）一组有序的指令，等待被装入，或者已经被装入并等待被执 
行。 

instruction register (指令寄存器 ( IR )) CPU 内的寄存器，保存当前指令以待分派和执行。 
instruction set (指令集）某特定 CPU 能执行的一组操作。 

integrated circuit (集成电路）一个制造在单个珪芯片上的电路而不是很多分立元件。 
interface (接口）一个抽象的类，定义了不同对象共享的行为，但在正常的继承结构之外。 
interrupt (中断）1.一小段预先建立的代码，当特定事件发生时执行。2.对 CPU 的通知，告 
诉 CPU 事件已经发生，这一段代码应该执行了。 
interrupt handler (中断处理 程序） 一个用于处理期望事件而无需忙碌-等待开销的系统。 
invoke (调 用） 执行一个方法。 
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I/O controller (I/O 控 制器） 典型机器体系结构的一个部件，用于控制一个特定的外设进行 

输入和输出。 I / O 控制器通常接受和解释来自总线的信号，并照顾在操作特定部件如硬驱 
时的细节。 

I/O registers (I/O 寄存器）用于发送信号到一个 I/O 控制器的寄存器，尤其是在 Atmel AVR 
上。 

IP 即指令指针，是一个标准的 CPU 寄存器’保存了正在执行的当前指令的位置。 
jasmin ( jasmin ) 由 Meyer 和 Downing 为 JVM 写的汇编器，本书的主要教学语言。 

Java Virtual Machine (Java 虚拟机）见 JVM 。 ° 

JIT compilation (JIT 编译〉一种加速 JVM 程序执行的技术’是通过将每条语句转换成等价 
的本地机器语言指令实现的。 

Just In Time (即)见 JIT 编译。 

JVM —个作为 Java 编程语言基础的虚拟机，本书的主要教学机器。 

label ( 标号）在汇编语言中，是针对特定代码行的可读标记，使得该行可作为转移指令的目 
标。 

latency (等待时间）完成某亊所需要的时间。在一个指令等待时间为 1 叫的计算机上，执行 
一条指令至少需要这些时间。 

linear congruential generator (线性同余数生 成器） 一个通用的伪随机数生成器，生成器连 
续返回的是形为 newvalue=(a • oldvalue + c )% m 的等式的值。 
link (链接）将存储于磁盘上的一组字节码（或机器指令）转换成可执行格式的过程。 
little-endian (小端字 节序） 一种存储格式，其中最低有效位被存储在一个字的第一个和最 
rS 序的位。在小端字节序格式中，数327 7 0被存储为二进制数01000001。 
llasm ( llasm ) 与微软的 . NET 框架一起使用的汇编器 # 

,oad (装入）将一组字节码（或机器指令）从磁盘转移到存储器的过程。 
logical address (逻辑地址）存储在寄存器中的位槟式，用于在由任何存储苷理或虚拟存储 
例程解释之前访问存储器。 

logical memory (逻辑存储器）由一组逻辑地址定义的地址空间，与由存储管理器存储数据 
的物理存储器相区别。 

logical shift (逻辑移位） 一 种移位操作，其中新空出的位置用 0 值来填充。与算术移位相比 
较。 

long (长整数）在 Java 或 Jasmin 中，一种 64 位（两个字）整数类型的数据存储格式。 
low-level (低级）一种像 jasmin 或其他汇编语言的语言，其中单个语句对应于单个机器语言 
指令。 

machine code (机器码）见机器 语言。 

machine cycle (机器周期）计算机的一个基本时间单位，典型地定义为执行单条指令所需 
时间，或者也可以定义为系统时钟的时间单位。 
machine language (机器语言）计算机程序的基本指令的二进制 编码。 机器语言一般不是 
由人写的，而是由其他程序如编译器或汇编器生成的。 
machine state register (机器状态寄存器）一个将计算机的总体状态描述为一组标志的寄存 
器。 

mantissa (尾数）一个浮点数的分数部分，即将要用一个包含 2 的某次幂的比例因子相乘。 
math coprococessor (数学协处理器）一个辅助芯片，通常用于浮点计算，而 ALU 处理的 
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是整数计算。 

memory-manager (存储管理器）一个用于控制程序访问物理存储器的系统。它通常能提髙 
性能、增加安全性、并增大程序能使用的存储量。 
memory-maped I/O (存储器-映射的 I / O ) —种执行 I / O 的方法，其中 I / O 控制器自动读特定 
的存储位置而不使用总线。 

microcontroller (微控制器）一种小的计算机，通常是嵌入式系统的组成部分，而不是独立 
可编程的计算机的组成部分。 

microprogramming (微程序设计）将计算机的（复杂）指令集实现为一序列较小的类 RISC 
的指令。 

Microsoft Intermediate Language (微软中间语言）见 MSIL 。 

MIMD 计算机在两个不同部分同时执行两个不同指令的能力。 

MMX instructions ( MMX 指令）在 80 x 86 系列芯片的较后的模型上实现 SIMD 并行性的指令。 
mnemonic (助记符）一种可读的汇编语言程序的一部分，对应于特定的操作或操作代码。 
mode (模式）见 addressing mode (寻址模式 >• 
modulus (模数）“余数”的形式化数学定义， 

monitor (监 视器） JVM 的一个子系统，用于确保在同一时间只有一个方法/线程能访问一块 
数据。 

Monte Carlo simulation (蒙特卡洛模拟）一种通过重复使用随机数来探索大规模解空间的 
技术。 

most significant (最高有效）对应于基数的最髙幕的数字或字节。例如，对于数361402, 
数字3就是 ft 商有效数字。还请见大端字节序、小端字节序。 
motherboard (母板）计算机板， CPU 和多数至关重要的其他部件都 W 于其上。 

MSIL 对应于 JVM 字节码的语言，是微软 .NET 框架的基础。 

MSR 见机器状态寄存器。 

nonvolatile memory (非易失存储器）即使是在掉电后所存储的数据仍存在的存储器。 
Non-Volatile RAM (非易失 RAM ) 见 NVRAM 。 

normalized form (规格化形式）典型浮点数的标准格式（根据 IEEE 754 标 准）。 这种格式包 
括：一个符号位、一个 8 位偏置指数、以及一个 23 位尾数（隐含由 1 打头）。 
n-type (n 型）一种用能提供电子的物质掺杂的半导体，使这些电子能传导电流。 
null (null) 一个指定的地址，不特別引用任何东西。 

NVRAM (NVRAM) 结合了 RAM 的现场可编程性和 ROM 的持久性的混合存储器。 
nybble (半字节） 4个位的一组，指的是一个十六进制数字。用作为表示存储器大小的单位， 
或者寄存器容量。很少使用。 

object-oriented programming (面向对象的编程）一种编程风格，由干 Smalltalk 、 C ++ 以及 
Java 等语言而广为人知。在这种编程风格中，程序由相互作用的类和对象组成，通信通 
过调用特定对象上的方法来完成。 
octal (八 进制） 基为8 。现在很少使用了。 

OF 溢出标志，当最近的带符号数操作产生对于寄存器而言过大的解时，就将其置位。 
offset (偏移）存储器中两个位置之间的距离。通常与基寄存器（如在8088存储器段中）一 
起使用，或者也可作为转移指令改变 PC 的最。 

opcode (操作代码）与机器代码中特定操作相对应的字节。与 mnemoinc (助记符）比较。 
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operands (操作数）特定操作的参数。例如， ADD 指令通常接受两个参数。然而，在 JVM 
中， iadd 不接受任何参数，因为两个参数都已经在堆栈上了。 
operating system (操作系统）一个控制程序，用于控制机器对用户级程序的可用性，并在 
适当的时间发起和恢复。操作系统的常见例子是 Windows 、 Linux , MacOS 及 OS X 。 
operator (操作符）指明哪个数学或逻辑函数应该被执行的符号或代码。例如，操作符+通 
常是指加法。 

OR (或） 一种布尔函数，当且仅当有一个参数为真时返回真，否则返回假。或门是针对输 
入电信号实现了或函数的硬件电路。 
overclocking (超频）试图用比芯片的额定速率快的时钟运行计算机。 
overflow (溢出）宽泛地说，就是当一个算术操作产生一个过大的值而不能存储到目标时。 

例如，两个8位数相乘就可能得出一个16位的结果，存储到8位的目标寄存器就会溢出。 
page (页）存储管理系统中所用的存储块。 

page table (页表）存储苷理器使用的表，用来确定哪个逻辑地址对应于哪个物理地址。 
paging (分页）将存储器分成“页”。或者说，是计算机在主存储器和长期存储器之间来回 
移动页的能力，用以扩展程序可得到的存储 fi 并提高性能。 
parallel (并联）在一个电路中，两个部件如果每个都有一个独立的路径，使得电流能独立 
流过，则这两个部件就是并联的。参见串联。 
parallelism (并行性）计算机在同一时间执行多个操作的 能力。 参见 MIMD 和 SIMD 。 

PC —个保存了当前正在被执行指令的存储位置的寄存器。改变这个寄存器的值将会导致从 
一个不同的位 K 装入下一条指令。这也就是转移指令的工作 原理。 
peripheral (外设）计算机的一个部件，用于读、写、示或存储数据，或者更一般地与外 
部世界交互。 

pipelining (流水线操作）像一个装配流水线一样将一个过程（一般是机器指令执行）分裂 
成若干个阶段。例如，计算机可能在执行一条指令的同时取下一条指令。一个典型的流 
水线体系结构可同时执行若干条不同的指令。 

Platter (盘片）在硬驱中的一个独立的存储表面。 

polling (轮洵）进行测试以发现某亊件是否已经发生 # 见 busy-waiting (忙碌-等待）。 
port-mapped I/O (端口映射的 I / O ) —种执行 I / O 的方法，其中与 I / O 控制器的通信是通过配 
«于主总线的特定端口实现的。 

Postfix ( 后缀）一种写表达式的方法，其中的二元操作符放在其操作数的后面，如 34 + 。可 
与 infix ( 中缀）或 prefix ( 前缀）比较。 

prefetch (预取）在前一条指令执行完毕前就取指令。一种粗糙形式的流水线操作。 

Prefix ( 前缀）一种写表达式的方法，其中的二元操作数放在其操作符的前面，如 +34 。可与 
中缀或后缀比较。 

primordial class loader (原始类加载器）主要的类加载器，负责加载和链接 JVM 中所有的 
类。 

program counter (程序计数器）见 PC 。 

programmable ROM (可编程 ROM ) 现场可编程（但不是可擦除的） ROM 。 与传统 ROM 芯 
片不同，这些芯片可进行少量的编程而无需建立全部的生产线。 
programming models (可编程模型（模式 ）） 一种对计算机体系结构和能力所定义的槪观， 
由于安全方面的原因故有限制。 
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PROM (PROM) 见 Programmable ROM。 

protected mode (保护模式）一种编程模式，其中程序的能力受存储管理和安全问题所限制。 

对在多处理系统上的用户级程序有用。 
pseudorandom (伪随机）一个由算法生成的近似随机性。 

P-type ( P 型）一种用能捕获电子（即“提供空穴”）的物质掺杂的半导体，使这些电子不能 
传导电流。 

radix point (基数小数点）“十进制小数点”思想的推广，是针对不限于 10 的基数。 

RAM 能够在任意位置读出和写入的存储器。 RAM 是易失性的，即掉电后则存储器中数据也 
会丢失。 

Random Access Memory (随机存取存储器）见 RAM 。 

Read-Only Memory (只读存储器）见 ROM 。 

real mode (实模式）一种编程模型，其中程序能使用机器的全部能力，绕开了安全性和存 
储管理。主要用干操作系统和其他的管理级程序。 
record (记录）一组命名的域，但没有方法。 
reduced instruction set computing (精简指令集计算）见 RISC 。 
register (寄存器） CPU 内部的一个存储位*,用于存储目前正在操作的数据和指令。 
register mode (寄存器模式）一种寻址模式，其中的一个位模式被解释为一个特定的寄存 
器。在寄存器模式中，位模式 0 x 0001 就会被解释成第一个寄存器。 
return ( return ) 在子例程结束时将控制传递回调用环境的过程（也常指返回所用的指令）。 
RISC —种计算机设计观点，即使用一些短的通用指令。与 CISC 相对。 

ROM 只能读出不能写入的存储器。 ROM 是非易失性的，即若掉电则存储器中的数据仍能保 
持。 

roundoff error (舍入误差）当一个浮点表示不能表示精确的值时所发生的误差，通常是因 
为定义的尾数过短。期望的值将被“舍入”到最接近的可表示的*。 

SAM 不能以任意顺序访问，却必须以预先定义的顺序访问的存储器，如磁带记录。 
seed (种子）用干开始生成伪随机数序列的值。 

segment (段）宽泛地说，是存储器中的一个连续 区域。 更明确地说，是由 80 x 86 系列的一 
个段寄存器所引用的一个存储器区域。 

segmentioffset (段： 偏移）在英特尔8088 (或以后的模型）的丨6位寄存器上表示 20 位逻辑 
地址的一种可选择的方式。 

segment register (段寄存器） 80x86 系列的一个寄存器，用于为代码、堆栈及数据定义存 
储块，并扩展可得到的地址空间。 

semiconductor (半导体）一种电材料，处于导体和绝缘体之间，可用于生成二极管、三极 
管、及集成电路。 

Sequential access memory (顺序访问存 储器〉 见 SAM 。 

series (串联）在一个电路中，两个部件如果只有一条路径使得电流流过两个部件，则这两 
个部件就是串联的。参见 parallel (并 联〉。 

SF 符号标志，当最近操作产生一个负的结果时将其罝位。 

Shift (移位）一种操作，其中寄存器中的位被移动到（左边或右边的）相邻位置。 
sign bit (符号位）在有符号数的表示中，用于指明值是正数还是负数的位。通常符号位为1 
用于表示负数。对于整数和浮点数都是这样。 
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signed (有符号的）一个可以为正或为负的量，与只能为正的无符号的量相对。 

SIMD ( SIMD ) 计算机在同一时间在不同的数据块上执行同一条指令的能力。例如，将存储 
器中若干个元件同时清零。 

Single Instruction Multiple Data (单指令多数据）见 SIMD 。 
source (源） 数据的来处。例如，在指令 iload _3 中，源就是局部变量#3。 
source index (源变址）在 80 x 86 类列中的一个寄存器，用于控制串原始操作的来源。 
source operand (源操作数）定义了一条指令的操作来源的操作数。在奔腾指令集中，源 
操作数通常就是在 MOV AX , BX 中的源操作数。 
src 源的简写。 

S-R flip-flop ( S - R 触发器）用于将单个位的值作为一组自增强晶体管的电压进行存储的电 
路。 

stack (堆栈）一种数据结构，其中的元素只能在一端插入（压入）和删除（弹出）。堆栈在 
机器体系结构中的用途是作为短期存储器生成和销毁新位置的方式。 
stack frame (堆栈帧）一种基于堆栈的内部数据结构，用于存储当前正在执行程序或子例 
程的局部环境。 

stack machine (状态机）一个计算机程序，其中计算机仅根据接收到的特定输入或事件从 
一种命名的“状态”变化到另一个状态。 
static (峥态的）见 class method (类方法 h 
static RAM (諍态 RAM ) 见 SRAM 。 

string primitive (串*元） 80x86 系列上的一种操作，用于对像串这样的字节数组进行移动、 
拷贝或其他处理。 

structure (结构）见 record (记 录）。 

subroutine (子例程）一个被封装的代码块，在程序执行的过程中可从若干个不同的 位置调 
用，之后控制再被传递回被调用的地点。 

superscalar (超标量）一种通过复制流水线或流水线段来增强性能，以达到 M 1 MD 并行性的 
方法。 

supervisor (苷理模式）一种特权编程模型，在这种模式下，计算机有能力以一种方式控制 
系统，而这种控制方式通常是安全体系结构所禁止的。管理模式通常为操作系统所使用。 
参见 real mode (实模式） 0 

this 在 java 中，就是其实例方法正在被调用的当前对象.在 jasmin 中，引用 this 的对象总是作 
为局部变量#0传递。 

throughput (呑吐 ft ) 每个时间单位能完成的操作数世。这与在多处理器上的等待时间 
( latency ) 或许不同，例如，多处理器能在相等的等待时间内同时完成若干个操作，实际 
上达到了期望呑吐《:的若干倍。 

Throwable (可抛出）在 JVM 中， athrow 指令抛出的一个对象、一个异常或者错误。 
timer (定时器）一种对时钟脉冲进行计数的电路，以确定流失的时间量。 
time-sharing (时间共享）一种形式的多重处理技术，其中 CPU 在一个时刻为一个程序运行 
一小段时间，这就给出了多个程序都在同时运行的幻觉。 
two's complement notation (二进制补码表示）一种存储带符号整数的技术，使得加法操作 
对于正数和负数都一样进行。在二进制补码表示中，-1的表示就是所有位都是1的位 
向量。 



typed (带类型的）就是在计算、表示、或操作中，被处理数据的类型影响到结果的合法性 
和正确性。例如， istore_0 就是一个带类型的操作，因为它只存储整数。相反， dup 操作 
是不带类型的，因为它复制任何的堆栈元素。 

U 在英特尔奔腾处理器上的两个5段流水线之一。 

unary (—元的）一种只接受一个操作数的数学操作，如取反或求余弦。 
unconditional (无条件的）总是，比如在一个无条件转移中，总是转移。 

Unicode —个字符表示的集合，包括了比 ASCII 更大址的字母。见 UTF -16。 
unsigned (无符号的）一个只能是正数或负数的量，与可正可负的带符号量相反。 
update mode (更新模式）一种寻址模式，其中寄存器的值在访问后被更新，如递增到下一 
个数组位置。 

user mode (用户模式）一组编程模式，其中程序的能力受到安全体系结构和操作系统的限 
制，以防止两个程序做有害的交互作用。 

UTF -16 与 ASCII 不同的字符编码方式，其中字符被作为16位的 M 存储。这就可允许在字符 
集中容纳多达65535种不同的字符，足够将大量的非英文和非拉丁字符包括进来。 

V 在英特尔奔腾上两个5段流水线之一。 

verifier (验证器）加载类文件并进行验证的阶段，或者执行这种验证的程序。 
verify (验证）在 JVM 上，就是确认一个方法或类可成功地运行而不会引起安全问题的过程。 
例如，试图将先前作为浮点数装入的值作为整数值存储就会引起一个错误，但在类文件 
被验证时可捕获到这个错误。 

virtual address (虚拟地址）在虚拟存储系统中的一个抽象地址，在实际存储器中可存在或 
不存在（并可在长期存储器中存在)。参见 logical mode (逻辑地 址〉。 
virtual address space (虚拟地址空间）见 virtual address (虚拟地址）。 
virtual memory (虚拟存 储器） 计算机解释逻辑地址并将其转换成物理地址的能力。也就是 
计算机访问实际上不在主存储器中的逻辑地址的能力，这是通过将逻辑地址空间的某些 
部分存储到磁盘并按需要装入到存储器来实现的。 
virtual segment identifier (虚拟段标志码）见 VSID 。 

VSID —个位模式，用于将逻辑地址扩展成更大的地址空间，为存储管理器所使用。 
watchdog timer (看门狗定 时器） 一种定时器，当触发时，就会复位计算机，或者进行检验 
以确认机器没有进入一个无限循环，或者无反应的状态。 
word (字）在机器中数据处理的基本单位，一般是通用寄存器的大小。在写这本书的时候 
(2006 年），多数可买到的计算机的典型值是32位。 

ZF 零标志位，当最近操作的结果为0时将其置位。 
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北京培生信患中心 

中国北京海淀区中关村大街甲 59 号 

人大文化大 * 〗 006 室 

邮政编 100872 

电话： （ 8610)82504008/9596/9586 

传真： (8610)82509915 



Information _ 
Room 1006 ，C 


Centre 

i.CullureSquare NoJ9 Jia, Zhongguancun Street 
Haidian Disiricl, Beijing. China 100872 
TEL: (8610)82504008/9596^586 


FAX: (8610)82509915 


尊敬的 老师： 

您好！ 

为了确保您及时有效地申请教辅资源，请您务必完整填写如下教辅申请表，加盖学院的公章 
后传真给我们，我们将会为您开通属于您个人的唯一账号以供您下载与教材配套的教师资源。 


请填写所需教辅的幵课 信息: 


采用教材 



□中文版□英文版 Q 双语版 

作 者 


出版社 


版 次 


ISBN 


课程时间 

始于 年月日 

学生人数 


止于 年月日 

学生年级 

□专科 □本科 1/2年级 
□研究牛□本科3/4年级 


请填写您的个人 信息: 


学 校 


院系/专业 


姓名 


职 称 

□助教□讲师□副教授□教授 

通佶地址/邮编 


手 机 


电 话 


传 % 


official email( 必填} 
(eg: XXX @ rue .cdu .cn) 


email 

(cg:XXX@163xom) 



是否愿意接受我们定期的新书讯息 通知： □是 □否 


系/院 主任： _(签字) 


(系/院办公室孝) 














義师服务營记表 
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尊敬的 老师： 

您好！感谢您购买我们出版的_ 教材。 

机械工业出版社华章公司为了进-步加强与高校教师的联系与沟通，更好地为商校教师服务，特 
制此表，话您填妥后发冋给我们，我们将定期向您寄送华章公司最新的图书出版信总！感谢合作! 

个人资料（请用正楷完整填写） 


教师姓名 


学校 


□先生 

□女士 


出生年月 


联系 

电话 


学历 


职务 


学院 


办公: 

宅电: 

移动: 


研究领域 


毕业院校 


联系地址 

及邮缟 


E-mail 


职称：□教授□副教授 

□讲师□助教□其他 


系别 


国外进修及讲学经历 


主讲课程 


课程 


□专□本□研 
人数： 学期： □春□秋 


课程 


□专□本□研 
人数： 学期： □春 G 秋 


现用教材名 


繼 


S!l 


教材满意度 


□满意□一般 
□不满意□希望更换 


□满意□一般 
□不满意□希望更换 


样书申请 




已出版译作 


是否應意从事翻译/著作工作 □是□否方向 


意 

见 

和 

速 

议 


填妥后请选择以下任何一种方式将此表 返回： （如方便请賬名片） 

地址： 北京市西城区百万庄南街1号华章公司营销中心 邮编： 100037 

电话： （010)68353079 88378995 传真： (010)68995260 

5hzbook.com 


E-mail:hzedu@hzbcx)k.com markerting@t 


图书洋情可登录 http:/, 


/www.hzboo 


k.corn 网站查询 

























